Foros del Web » Programando para Internet » PHP »

Obtener URLs sitio web??

Estas en el tema de Obtener URLs sitio web?? en el foro de PHP en Foros del Web. Sabeis alguna forma de obtener todas las urls de un sitio web? Es decir la url de todas las paginas que contiene ese sitio web. ...
  #1 (permalink)  
Antiguo 14/06/2015, 03:03
 
Fecha de Ingreso: diciembre-2004
Mensajes: 7
Antigüedad: 19 años, 4 meses
Puntos: 0
Obtener URLs sitio web??

Sabeis alguna forma de obtener todas las urls de un sitio web? Es decir la url de todas las paginas que contiene ese sitio web.

He visto que puede hacer con Phyton y Beautifulsoup pero me gustaria saber si es posible hacerlo con php.

Gracias.
  #2 (permalink)  
Antiguo 14/06/2015, 07:32
Avatar de pateketrueke
Modernizr
 
Fecha de Ingreso: abril-2008
Ubicación: Mexihco-Tenochtitlan
Mensajes: 26.399
Antigüedad: 16 años
Puntos: 2534
Respuesta: Obtener URLs sitio web??

Sí, es posible pero no es nada fácil.
__________________
Y U NO RTFM? щ(ºдºщ)

No atiendo por MP nada que no sea personal.
  #3 (permalink)  
Antiguo 14/06/2015, 08:07
Avatar de Apolo_13  
Fecha de Ingreso: mayo-2015
Mensajes: 40
Antigüedad: 8 años, 11 meses
Puntos: 4
Respuesta: Obtener URLs sitio web??

Es muy sencillo, tan solo tienes que extraer la info de la pagina, y parsear todas sus url's.

Estas 2 funciones son la clave: preg_match_all() y get_file_contents().
Busca mas info sobre ellas, son muy fáciles de utilizar.

Saludos!
__________________
¿Buscas respuestas? eemmmmm.....¡Abstrae tu mente!
  #4 (permalink)  
Antiguo 14/06/2015, 08:10
Avatar de pateketrueke
Modernizr
 
Fecha de Ingreso: abril-2008
Ubicación: Mexihco-Tenochtitlan
Mensajes: 26.399
Antigüedad: 16 años
Puntos: 2534
Respuesta: Obtener URLs sitio web??

Cita:
Iniciado por Apolo_13 Ver Mensaje
Es muy sencillo, tan solo tienes que extraer la info de la pagina, y parsear todas sus url's.

Estas 2 funciones son la clave: preg_match_all() y get_file_contents().
Busca mas info sobre ellas, son muy fáciles de utilizar.

Saludos!
Claro, y luego hay que hacerlo recursivamente, guardando un caché para evitar descargar todo dos veces, así de simple.

Por cierto, la función get_file_contents() no existe, creo que te refiere a file_get_contents().

Evita decir mentiras para no confundir a los usuarios.
__________________
Y U NO RTFM? щ(ºдºщ)

No atiendo por MP nada que no sea personal.
  #5 (permalink)  
Antiguo 14/06/2015, 08:30
Avatar de Apolo_13  
Fecha de Ingreso: mayo-2015
Mensajes: 40
Antigüedad: 8 años, 11 meses
Puntos: 4
Respuesta: Obtener URLs sitio web??

Vale, gracias por corregirme, es cierto, no existe. La memoria humana no es perfecta jaja!

Y lo de la cache, si es una buena idea para hacerlo mucho mas eficiente. ;)
__________________
¿Buscas respuestas? eemmmmm.....¡Abstrae tu mente!
  #6 (permalink)  
Antiguo 14/06/2015, 11:06
 
Fecha de Ingreso: diciembre-2004
Mensajes: 7
Antigüedad: 19 años, 4 meses
Puntos: 0
Respuesta: Obtener URLs sitio web??

Entonces es mas facil que obtengas las urls con phyton y beautifulsoup y ya luego las trato con php o lo que prefiera ¿No?

Gracias por responderme!
  #7 (permalink)  
Antiguo 14/06/2015, 12:40
Avatar de NSD
NSD
Colaborador
 
Fecha de Ingreso: mayo-2012
Ubicación: Somewhere
Mensajes: 1.332
Antigüedad: 11 años, 11 meses
Puntos: 320
Respuesta: Obtener URLs sitio web??

how do i make a simple crawler in php
__________________
Maratón de desafíos PHP Junio - Agosto 2015 en FDW | Reglamento - Desafios

Etiquetas: urls
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 08:23.