|    
			
				01/05/2003, 03:59
			
			
			  | 
  |   |  |  |  Fecha de Ingreso: enero-2002 Ubicación: Graná 
						Mensajes: 646
					 Antigüedad: 23 años, 9 meses Puntos: 0 |  | 
  |  separar texto  
  hola, tengo un gran problema: necesito quitarle todas las marcas HTML a una página y luego meterlo todo en una matriz. Para ello uso la función
 function stripHTML(txt)
 set Reg = new RegExp
 Reg.pattern = "[<][^>]*[>]"
 Reg.IgnoreCase = true
 Reg.Global = true
 stripHTML = Reg.Replace(txt,"")
 end function
 
 luego le quito todos los caracteres especiales como el punto, la coma, los acentos, los dobles espacios, etc, es decir, que dejo el texto solo con un espacio entre cada palabra. Luego le hago un split poniendo como carácter de separación el espacio, pero hay algunos que no los hace bien, por ejemplo, hay espacios que los coge como si fueran palabras, o a lo mejor deja un espacio delante e una palabra. ¿Qué puede ser? Estoy ya desesperado. Gracias
     |