Foros del Web » Programando para Internet » PHP »

Parsear web que requiere login

Estas en el tema de Parsear web que requiere login en el foro de PHP en Foros del Web. Qué tal gente? Estoy haciendo unos scripts que parsean información de unos trackers (en los cuales tengo cuenta) y me devuelven cierta información. Una especie ...
  #1 (permalink)  
Antiguo 12/02/2011, 16:13
Avatar de azeos  
Fecha de Ingreso: junio-2008
Mensajes: 7
Antigüedad: 15 años, 9 meses
Puntos: 0
Parsear web que requiere login

Qué tal gente?

Estoy haciendo unos scripts que parsean información de unos trackers (en los cuales tengo cuenta) y me devuelven cierta información. Una especie de buscador.

El problema que tengo, es que éstas webs requieren login, por lo que los scritps no funcionan. Los probé de forma "offline", bajando los HTML y están parseando bien. Por lo que el único inconveniente que tengo es con el "login".

¿Puede ser que la solución venga por el lado de cookies? Mi idea es loguearme al sitio en cuestión y que luego el script ya me detecte como logueado. No quiero loguearme desde el script.

Nunca trabajé con cookies, por lo que no se por donde arrancar. No se si me tengo que fijar que cookies genera cada sitio, o qué.
En fin, cualquier ayuda será bienvenida. Tengan en cuenta que soy un novato en todo esto.

Saludos y desde ya muchas gracias.

EDIT: Bueno, ya lo tengo casi resuelto. Lo q hice fue leer las cabeceras q mandaba el sitio con un addon para firefox (Live HTTP Headers). Luego puse esas caeberas como parámetro en el file_get_contets mediante un stream_context_create.
Si en la cabecera cargo a mano la cookie del sitio, funciona como si estuviera logueado, hasta ahí todo bien.
Ahora el problema, es q tengo q automatizarlo. Hay forma de hacer un script para leer la cookie de X sitio?

Última edición por azeos; 14/02/2011 a las 18:56

Etiquetas: login, requiere, parse
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 20:17.