Ver Mensaje Individual
  #1 (permalink)  
Antiguo 03/09/2010, 07:18
Avatar de djagu_26
djagu_26
 
Fecha de Ingreso: enero-2008
Ubicación: Montevideo, Uruguay
Mensajes: 518
Antigüedad: 16 años, 3 meses
Puntos: 6
remover html de un string

Hola a todos, tanto tiempo?. Bueno para ello he encontrado este metodo que casi funciona.

Código:
public String getTextoPlano(){
	String htmlString = this.definicionInicial;
	String noHTMLString = htmlString.replaceAll("\\<.*?\\>", " ");
        return noHTMLString;
}
Digo casi, porque cuando en el html tengo caracteres especiales como ñ, á, é, etc al hacer el reemplazo me los traduce en &ntilde; &aacute; &eacute; , etc.

Una solucion podria ser hacer:

noHTMLString = htmlString.replaceAll("&ntilde;", "ñ"); (y asi con todos los caracteres especiales)

Pero me gustaria saber si alguien tiene alguna solucion mas prolija que no implique hacer un replaceAll por cada caracter especial ya que son muchisimos.

Saludos y gracias
__________________
"La magia no existe, la programacion si"

A/P Agustin Sivoplas
[email protected]