Ver Mensaje Individual
  #1 (permalink)  
Antiguo 20/06/2009, 12:07
Avatar de Dundee
Dundee
 
Fecha de Ingreso: junio-2002
Ubicación: El Médano
Mensajes: 1.310
Antigüedad: 21 años, 10 meses
Puntos: 8
como empezar spider

Hola gente como estamos ??. estoy buscando por google algún tipo de información para poder empezar un proyecto personal que me he propuesto; se trata de un spider que entre en determinadas webs y siga las Url siguiendo unos patrones (como puede ser el title de los href o el ALT de las etiquetas IMG por ejemplo), patrones definidos por mi lógicamente.

El tema es que necesito crear un spider que rastré el código fuente (no lo que veen los usuarios sino el código puro y duro) y no tengo ni idea por donde empezar. No busco que nadie me de la solución mágica para hacerlo, pero quizás si algún tipo de referenacia a manual, tutorial, o libro que explique este tema.

Mis conocimientos en php no son malos, pero nunca he tocado el tema de los spiders y por eso pido orientación al respecto.

Despúes de haber googleado un buen rato he encontrado muchas cosas pero nada que explicara lo que necesito o algo que se le pareciera, lo que si he visto es un enlace a como no php.net.
http://www.php.net/manual/es/ref.curl.php

Pero no tengo muy claro que para programar el spider usar esas librerias CURL sea lo más aconsejable , ¿lo es?, ¿debo programar mi spider con las librerias CURL?.

Un saludo y gracias de antemano.