Ver Mensaje Individual
  #1 (permalink)  
Antiguo 13/10/2012, 20:07
Avatar de xarmagedonx
xarmagedonx
 
Fecha de Ingreso: marzo-2009
Mensajes: 360
Antigüedad: 15 años, 2 meses
Puntos: 29
Pregunta Extrayendo contenido de una url

Hola compañeros de FDW!!!

Actualmente estoy extrayendo la meta descripción y keywords de una url, pero el problema es que no todos los sitios web tienen las meta description y meta keywords.

El código que estoy utilizando es el siguiente:

Código PHP:
Ver original
  1. [...]
  2. //Acá se encuentra un if
  3. preg_match_all ("(<meta name=\"description\" content=\"(.*)\"\/>)siU", $html, $description);
  4. preg_match_all ("(<meta name=\"keywords\" content=\"(.*)\"\/>)siU", $html, $keys);
  5. $descripcion = $description[1][0];
  6. $keywords = $keys[1][0];
  7. storeLink($descripcion,$url,$keywords);
  8. }
  9. [...]

Bueno, lo que intento hacer es que si no se encuentra la meta description extraiga entonces el primer <p></p> de la web. Y en caso de que no exista la meta keywords que extraiga todos los encabezados y texto en negrita e italic.

¿Cómo puedo lograr guardar otro contenido en la base de datos, en caso de que las metas no existan?

Tengo ya los códigos de como extraer los encabezados todos los textos en negrita e italic, pero nose como lograr que reemplazen a la meta keywords en caso de que no se encuentre en el html del sitio.

Un saludo y espero que puedan ayudarme!!!

PD: si no se entendió muy bien lo que quería decir, diganme y se los intento explicar mejor.