Hola, estoy desarrollando una aplicación JAVA que se conecta a un servidor WEB y descarga una pagina, luego extraigo el texto obtenido y lo codifico en xml.
El problema que tengo es que a veces el texto contiene "ñ" o u con diéresis.
Por ejemplo caño o cigüeñal.
Cuando creo el xml, lo hago en un StringBuffer, y luego lo convierto a string usando la función toString, los caracteres mencionados se codifican como 3 bytes.
Por ejemplo la ñ pasa a ser 0xEF 0xBF 0xBD.
¿Hay alguna forma de indicarle a JAVA que tipo de codificación estoy usando?
¿O se les ocurre alguna otra forma de solucionar esto?
Edito:
Me olvidaba, estoy editando los archivos .java en NetBeans pero compilo con Ant.
Acabo de probar preseteando(hardcoding) una variable con ñ y ya desde NetBeans se codifican como A+- y si edito el texto con un editor de texto y fuerzo las ñ el compilador Ant me indica que no puede convertir a UTF-8 esos caracteres. :(
Ya lo resolví, gracias de todos modos.