Foros del Web » Programando para Internet » PHP »

Problema con Chino, japonés etc...

Estas en el tema de Problema con Chino, japonés etc... en el foro de PHP en Foros del Web. Hola, Tengo problemas a la hora de tratar texto en chino, japonés... vamos caracteres diferentes a lo que usamos. Cuando son textos en castellano, inglés, ...
  #1 (permalink)  
Antiguo 07/09/2005, 13:11
Avatar de yampoo  
Fecha de Ingreso: noviembre-2001
Ubicación: Vilanova i la Geltrú
Mensajes: 1.942
Antigüedad: 22 años, 4 meses
Puntos: 0
Problema con Chino, japonés etc...

Hola,

Tengo problemas a la hora de tratar texto en chino, japonés... vamos caracteres diferentes a lo que usamos.

Cuando son textos en castellano, inglés, etc... consigo tener el texto limpio, sin caracteres raros ni nada... pero cuando llega el chino o alguno de estos se lía la de diós...

Para limpiar el texto de una cadena uso en el siguiente orden: html_entity_decode(), utf8_decode(), strip_tags(), htmlentities() y me queda el texto limpio, pero con una cadena tipo: 历程图片整理】 见证春春从成都到长沙的过关之路 ·超级女声全收录 更多 ... pues me lo convierte en cosas raras menos eso... y claro, yo cuando voy a una página japonesa veo bien los caracteres, tengo instalado los caracteres de ese dioma.

¿Qué puede ser? Yo creo que puede ser lo del utf8... pero no sé...
  #2 (permalink)  
Antiguo 07/09/2005, 15:28
Avatar de yampoo  
Fecha de Ingreso: noviembre-2001
Ubicación: Vilanova i la Geltrú
Mensajes: 1.942
Antigüedad: 22 años, 4 meses
Puntos: 0
No hay manera...

Estoy probando con

Código PHP:
<?
$tabla 
get_html_translation_table(HTML_ENTITIES);
$codificada html_entity_decode(htmlentities(strtr($_GET['cadena'],$tabla)));
echo 
$codificada;
?>
Y al poner en cadena: 掲示板、オークションなどの参加型コンテンツがあるディレクトリ。
Me devuelve:
Código PHP:
&aelig;Ž&sup2;&ccedil;&curren;&ordm;&aelig;&iquest;&atilde;&atilde;&ordf;&atilde;ƒ&frac14;&atilde;&macr;&atilde;&middot;&atilde;ƒ&sect;&atilde;ƒ&sup3;&atilde;&ordf;&atilde;&copy;&atilde;&reg;&aring;&aring;Š&nbsp;&aring;ž‹&atilde;&sup3;&atilde;ƒ&sup3;&atilde;ƒ†&atilde;ƒ&sup3;&atilde;ƒ„&atilde;Œ&atilde;&atilde;‚‹&atilde;ƒ‡&atilde;&pound;&atilde;ƒ&not;&atilde;&macr;&atilde;ƒˆ&atilde;ƒ&ordf;&atilde;€‚ 
Y con el html_entity_decode devuelve: 掲示æ¿ã€ã‚ªãƒ¼ã‚¯ã‚·ãƒ§ãƒ³ãªã©ã®å‚åŠ åž‹ã‚³ãƒ³ãƒ†ãƒ³ãƒ„ãŒã‚るディレクトリ。

¿Qué es lo que le falta o falla?
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 13:01.