Foros del Web » Programando para Internet » PHP »

Escanear página web y extraer información

Estas en el tema de Escanear página web y extraer información en el foro de PHP en Foros del Web. Buenas No tengo ni idea de si esto es posible o nó, pero me preguntaba si es posible "escanear" una página web, es decir, como ...
  #1 (permalink)  
Antiguo 06/01/2009, 14:01
Avatar de IMAC/  
Fecha de Ingreso: octubre-2005
Mensajes: 738
Antigüedad: 18 años, 6 meses
Puntos: 14
Escanear página web y extraer información

Buenas

No tengo ni idea de si esto es posible o nó, pero me preguntaba si es posible "escanear" una página web, es decir, como pillar el código estático que ves cuando das a "ver código fuente" en una página web, y luego usarlo para extraer mediante php la información que quieras, bien sean noticias, links...etc.

Gracias.
  #2 (permalink)  
Antiguo 06/01/2009, 15:06
Avatar de pateketrueke
Modernizr
 
Fecha de Ingreso: abril-2008
Ubicación: Mexihco-Tenochtitlan
Mensajes: 26.399
Antigüedad: 16 años
Puntos: 2534
Respuesta: Escanear página web y extraer información

claro que si se puede....

revisa en el manual de PHP las funciones del sistema de archivos, o bien... usa sockets o CURL ¡¡como gustes!!

ya después, revisa acerca de expresiones regulares para extraer información de entre patrones...
__________________
Y U NO RTFM? щ(ºдºщ)

No atiendo por MP nada que no sea personal.
  #3 (permalink)  
Antiguo 06/01/2009, 15:19
Avatar de IMAC/  
Fecha de Ingreso: octubre-2005
Mensajes: 738
Antigüedad: 18 años, 6 meses
Puntos: 14
Respuesta: Escanear página web y extraer información

Gracias pateketrueke, ahora miraré a ver, ya te contaré.

Lo de las expresiones regulares no se si lo usaré... no las acabo de coger el gustillo, tal vez use alguna función php para extraer ciertas cosas.

Gracias ;)
  #4 (permalink)  
Antiguo 06/01/2009, 15:19
 
Fecha de Ingreso: diciembre-2007
Mensajes: 927
Antigüedad: 16 años, 4 meses
Puntos: 12
Respuesta: Escanear página web y extraer información

eso es mas conocido para los bots que hacen por php bajate el script de google viene el bot que checa por las pags y podras checar la funcion

salu2
  #5 (permalink)  
Antiguo 06/01/2009, 16:21
Avatar de duskrow  
Fecha de Ingreso: abril-2008
Mensajes: 267
Antigüedad: 16 años
Puntos: 8
De acuerdo Respuesta: Escanear página web y extraer información

USA LA FUNCION file()

esa funcion t extrae el codigo fuente de la web y lo guarda en un array , cada posision del array es una linea del codigo fuiente que copiastes

un ejemplo aki

Cita:
<?

$array = file('http://www.google.com');

for ( $i = 0 ; $i < count($array) ; $i++ ) {

echo $array[$i] ;

}


?>
  #6 (permalink)  
Antiguo 06/01/2009, 16:37
Avatar de Ronruby  
Fecha de Ingreso: julio-2008
Ubicación: 18°30'N, 69°59'W
Mensajes: 4.879
Antigüedad: 15 años, 9 meses
Puntos: 416
Respuesta: Escanear página web y extraer información

Es mejor usar file_get_contents()
http://www.php.net/manual/es/functio...t-contents.php
  #7 (permalink)  
Antiguo 06/01/2009, 16:43
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 17 años, 11 meses
Puntos: 2135
Respuesta: Escanear página web y extraer información

El problema de ambas funciones es que dependen de que allow_url_fopen este activado, si esta desactivado no sirve.

Saludos.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 05:07.