Foros del Web » Programando para Internet » PHP »

problemas con caracteres raros

Estas en el tema de problemas con caracteres raros en el foro de PHP en Foros del Web. Tengo un script que lee datos de webs externas mediante file_get_contents y patrones. Rescato entre otras cosas el título de la web. Por ejemplo: http://www.elmundo.es/elmundo/2011/0...315077775.html ...
  #1 (permalink)  
Antiguo 12/10/2011, 11:14
Avatar de humanista  
Fecha de Ingreso: abril-2005
Mensajes: 878
Antigüedad: 19 años
Puntos: 15
problemas con caracteres raros

Tengo un script que lee datos de webs externas mediante file_get_contents y patrones. Rescato entre otras cosas el título de la web.

Por ejemplo:

http://www.elmundo.es/elmundo/2011/0...315077775.html

En lugar de salir:

Más de 400.000 personas se manifiestan en Israel en la llamada 'Marcha del millón' | Mundo | elmundo.es

Me sale:

M�s de 400.000 personas se manifiestan en Israel en la llamada 'Marcha del mill�n' | Mundo | elmundo.es


y en youtube,

http://www.youtube.com/watch?v=UK3hC1xxHQM

En lugar de salirme: Dinero y conciencia: ¿A quién sirve mi dinero? me sale:

Dinero y conciencia: ¿A quién sirve mi dinero? - YouTube


Para solucionar lo de youtube uso:

Código PHP:
Ver original
  1. $titlelink = html_entity_decode ($titlelink);

Para solucionar lo de elmundo.es uso:

Código PHP:
Ver original
  1. $titlelink = htmlentities($titlelink,ENT_QUOTES);

El tema es que ambos a la vez no funcionan, si arreglo el problema de uno se me fastidia el del otro y viceversa. qué estoy haciendo mal?
  #2 (permalink)  
Antiguo 12/10/2011, 11:24
 
Fecha de Ingreso: julio-2008
Ubicación: Barcelona
Mensajes: 2.100
Antigüedad: 15 años, 9 meses
Puntos: 165
Respuesta: problemas con caracteres raros

prueba con utf8_encode y decode, mira la codificación de tu web, saludos!
__________________
Gracias por el Karma :D

empleo ofertas de trabajo
  #3 (permalink)  
Antiguo 12/10/2011, 11:45
 
Fecha de Ingreso: julio-2005
Mensajes: 310
Antigüedad: 18 años, 9 meses
Puntos: 36
Respuesta: problemas con caracteres raros

utf8_encode sólo funciona con UTF-8 e ISO-8859-1 y seguramente todas las webs que vayas a leer utilicen alguna de estados codificaciones. Pero si tienes problemas con alguna web especial deberás probar la función iconv

Saludos
  #4 (permalink)  
Antiguo 12/10/2011, 13:56
Avatar de humanista  
Fecha de Ingreso: abril-2005
Mensajes: 878
Antigüedad: 19 años
Puntos: 15
Respuesta: problemas con caracteres raros

he probado con cada una de las soluciones que me dáis y nada, sigue sin ir. toda mi web está en utf-8, los cotejamientos tb, los campos de la tabla idem, los charset tb. creo q todo guarda coherencia...
  #5 (permalink)  
Antiguo 12/10/2011, 14:22
Avatar de Artificium  
Fecha de Ingreso: enero-2011
Mensajes: 492
Antigüedad: 13 años, 3 meses
Puntos: 81
Respuesta: problemas con caracteres raros

Te propongo una cosa bien simple y algo tramposa: puedes diferenciar si los datos vienen de una fuente u otra: si vienen de el mundo o de youtube y a cada uno dale un tratamiento correcto independiente. Qué te parece?
  #6 (permalink)  
Antiguo 12/10/2011, 15:02
Avatar de humanista  
Fecha de Ingreso: abril-2005
Mensajes: 878
Antigüedad: 19 años
Puntos: 15
Respuesta: problemas con caracteres raros

pues... el tema no debería ser así pq puede haber 1 millón de fuentes diferentes, aquí sólo os he puesto 2 ejemplos pero la cosa es que trae texto desde cualquier link que le pases
  #7 (permalink)  
Antiguo 13/10/2011, 08:39
Avatar de Artificium  
Fecha de Ingreso: enero-2011
Mensajes: 492
Antigüedad: 13 años, 3 meses
Puntos: 81
Respuesta: problemas con caracteres raros

Aquí hay algo que te puede servir:

http://php.apsique.com/contenido/detectando_utf8_php

Etiquetas: caracteres, html, raros
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 09:28.