Ver Mensaje Individual
  #1 (permalink)  
Antiguo 11/01/2013, 13:59
Avatar de Dundee
Dundee
 
Fecha de Ingreso: junio-2002
Ubicación: El Médano
Mensajes: 1.310
Antigüedad: 21 años, 10 meses
Puntos: 8
Extraer página con CURL y recuperar datos de tabla

Hola gente, he trabajado bastante con PHP pero poco con CURL , la verdad que no me ha resultado muy complicado recuperar un sitio remoto con CURL, pero me surgen algunas dudas ya que nunca he hecho esto y no tengo muy claro algunas cosas.

El código que utilizo es este:


Código:
$url="laquesea.com";
$ch = curl_init($url);//URL A ENVIAR EL CONTENIDO
  
        curl_setopt ($ch, CURLOPT_POST, 1);//SETEAMOS LA VARIABLE DE ENVIAR DE CONTENIDO POST EN TRUE (1)
        curl_setopt ($ch, CURLOPT_POSTFIELDS, 'cuerpo=I590&especialidad=004'); //SETEAMOS LOS VALORES A ENVIAR
   
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);//OPCIONAL: NO RETORNARA EL RESULTADO DE LA OPERACION
    curl_setopt($ch, CURLOPT_COOKIEJAR, "cookies/cookies-ja.txt");
    curl_setopt($ch, CURLOPT_COOKIEFILE, "cookies/cookies-ja.txtt");
   
    $html = curl_exec ($ch);//EJECUTAMOS
    curl_close ($ch);//CERRAMOS
Las dudas que tengo son las siguientes.

1 La página que recupero es una tabla con sus tr y td donde estan los datos que quiero guardar en una Bd en mi servidor local Mysql.

2 Dicha página esta páginada , por lo que necesito además de recuperar el contenido de la página de "aterrizaje" (la primera), recupere el contenido del resto de páginas.

3 Como se puede comprobar en la líneas de CURL :
curl_setopt ($ch, CURLOPT_POSTFIELDS, 'cuerpo=I590&especialidad=004'); le tengo que pasar por post datos para simular el formulario de entrada que tiene dicha web.

4 Una vez que recupero la página , no se como puedo "sacar" solo los datos que necesito y moverme por el dom de manera que pueda guardar en mi bd "nombre", "telf", "posición" etc etc.. que son datos que encontramos dentro de los TDs. Y claro esto sería lo suyo que lo pudiera hacer en todas las páginas (ya que está paginado).

Bueno no pretendo que nadie me lo haga Xd, pero si agradecería cualquier tipo de orientación , puesto que es la primera vez que me encuentro con un tema así en PHP; y he "googleado" mucho estos dos días buscando sobre este tema , y la verdad que he encontrado muchas cosillas (gracias a eso he podido recuperar la página y empezar a hacer algo con CURL), pero estoy aún muy lejos de conseguir lo que deseo, que es indexar todos esos datos en una bd que tengo en local.

Por ejemplo he encontrado esto en PHP.net sobre DOMXPath , pero la verdad que no entiendo muy bien como funciona, ya que la explicación de PHP.net es como poco pobre (si alguien me puede decir donde encontrar más info sobre esto y sobre todo si esto me sirve , se lo agradecería mucho).

Mil gracias de antemano.
__________________
Videotutoriales de Drupal