Foros del Web » Programando para Internet » ASP Clásico »

separar texto

Estas en el tema de separar texto en el foro de ASP Clásico en Foros del Web. hola, tengo un gran problema: necesito quitarle todas las marcas HTML a una página y luego meterlo todo en una matriz. Para ello uso la ...
  #1 (permalink)  
Antiguo 01/05/2003, 03:59
 
Fecha de Ingreso: enero-2002
Ubicación: Graná
Mensajes: 646
Antigüedad: 22 años, 5 meses
Puntos: 0
separar texto

hola, tengo un gran problema: necesito quitarle todas las marcas HTML a una página y luego meterlo todo en una matriz. Para ello uso la función

function stripHTML(txt)
set Reg = new RegExp
Reg.pattern = "[<][^>]*[>]"
Reg.IgnoreCase = true
Reg.Global = true
stripHTML = Reg.Replace(txt,"")
end function

luego le quito todos los caracteres especiales como el punto, la coma, los acentos, los dobles espacios, etc, es decir, que dejo el texto solo con un espacio entre cada palabra. Luego le hago un split poniendo como carácter de separación el espacio, pero hay algunos que no los hace bien, por ejemplo, hay espacios que los coge como si fueran palabras, o a lo mejor deja un espacio delante e una palabra. ¿Qué puede ser? Estoy ya desesperado. Gracias
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 02:07.