Java y las ñ

E_Blue · #1 (**permalink**) 14/12/2012, 08:22

Hola, estoy desarrollando una aplicación JAVA que se conecta a un servidor WEB y descarga una pagina, luego extraigo el texto obtenido y lo codifico en xml.

El problema que tengo es que a veces el texto contiene "ñ" o u con diéresis.

Por ejemplo caño o cigüeñal.

Cuando creo el xml, lo hago en un StringBuffer, y luego lo convierto a string usando la función toString, los caracteres mencionados se codifican como 3 bytes.

Por ejemplo la ñ pasa a ser 0xEF 0xBF 0xBD.

¿Hay alguna forma de indicarle a JAVA que tipo de codificación estoy usando?
¿O se les ocurre alguna otra forma de solucionar esto?

Edito:
Me olvidaba, estoy editando los archivos .java en NetBeans pero compilo con Ant.
Acabo de probar preseteando(hardcoding) una variable con ñ y ya desde NetBeans se codifican como A+- y si edito el texto con un editor de texto y fuerzo las ñ el compilador Ant me indica que no puede convertir a UTF-8 esos caracteres. :(

Ya lo resolví, gracias de todos modos.