Foros del Web » Programando para Internet » PHP »

Cargar paginas web para filtrarlas

Estas en el tema de Cargar paginas web para filtrarlas en el foro de PHP en Foros del Web. Necesito crear un script que pueda hacer las veces de "spider" por una web, la cargue entera,, siga sus enlaces, para que la pueda procesar ...
  #1 (permalink)  
Antiguo 06/08/2003, 08:49
 
Fecha de Ingreso: agosto-2003
Mensajes: 3
Antigüedad: 14 años, 4 meses
Puntos: 0
Cargar paginas web para filtrarlas

Necesito crear un script que pueda hacer las veces de "spider" por una web, la cargue entera,, siga sus enlaces, para que la pueda procesar despues . ¿Que funcion hace esto? lo he probado con fopen y deja mucho que desear
  #2 (permalink)  
Antiguo 06/08/2003, 10:50
Avatar de goncafa  
Fecha de Ingreso: julio-2002
Ubicación: Santiago
Mensajes: 1.211
Antigüedad: 15 años, 5 meses
Puntos: 10
la funcion file() lee el archivo y deja cada linea en un elemento de un array, ya la probaste??

Saludos
__________________
se despide hasta la proxima
Gonzalo Castillo
  #3 (permalink)  
Antiguo 06/08/2003, 11:22
 
Fecha de Ingreso: agosto-2003
Mensajes: 3
Antigüedad: 14 años, 4 meses
Puntos: 0
Gracias, ya lo he conseguido con la funcion show_source() de php4

Un saludo
  #4 (permalink)  
Antiguo 06/08/2003, 11:37
Avatar de Manoloweb  
Fecha de Ingreso: enero-2002
Ubicación: Monterrey
Mensajes: 2.454
Antigüedad: 15 años, 10 meses
Puntos: 5
Un spider con show_source???



Que tipo de spider estas desarrollando?
__________________
Manoloweb
  #5 (permalink)  
Antiguo 06/08/2003, 11:59
 
Fecha de Ingreso: agosto-2003
Mensajes: 3
Antigüedad: 14 años, 4 meses
Puntos: 0
Es para recorrer de una pagina todas las referencias suyas, y seguirlas, obteniendo en un BD MySQL las referencias, direcciones e-mail y contenido de METAS.

Asi con varias paginas; es decir que es una pagina principal donde vienen varios URL y estos son los que se siguen hasta el objetivo final.

File() tiene el problema que no lee del codigo fuente, sino de la pagina html interpretada, me explico, no es lo mismo un enlace enlace1 que la pincharlo va a otro y que file extrae 1: enlace1

que el codigo fuente que extrae show_source() <a href="www.enlace1.com">enlace1 </a> con el que se puede trabajar.

Un saludo
  #6 (permalink)  
Antiguo 06/08/2003, 12:23
Avatar de Manoloweb  
Fecha de Ingreso: enero-2002
Ubicación: Monterrey
Mensajes: 2.454
Antigüedad: 15 años, 10 meses
Puntos: 5


Entendido. Muy creativa tu solución.
__________________
Manoloweb
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 13:14.