Ver Mensaje Individual
  #1 (permalink)  
Antiguo 15/09/2009, 11:14
beetle
 
Fecha de Ingreso: septiembre-2004
Mensajes: 17
Antigüedad: 19 años, 7 meses
Puntos: 0
XML Parser UTF8

Hola,

según la documentación de PHP (es2.php.net/manual/en/xml.encoding.php), el parser XML que proporciona parsea, entre otras codificaciones, UTF8, de manera automática, ya que se adapta a la codificación del input.

Bien, al parser XML le proporciono un input codificado bajo UTF8 (comprobado con mb_check_encoding), pero el paser, para un input del estilo "frü" me retorna dos veces el handler 'char' con el string "fr" y otra vez con el string "ü".

He hecho pruebas y no parece que funcione bien en cuanto le pasas acentos, diéresis etc. Ni aunque le indiques la codificación del input:

xml_parser_set_option($xml_parser, XML_OPTION_TARGET_ENCODING,
"utf-8");

Aunque según la documentación esto no haría falta.

He mirado bastante por google y foros y esto parece ser un problema. No he logrado ver una soluciñon al asunto.

¿Cómo se puede parsear un XML en el que haya contenido con este tipo de caracteres?

Gracias.