Foros del Web » Programando para Internet » PHP »

Leer y examinar páginas.

Estas en el tema de Leer y examinar páginas. en el foro de PHP en Foros del Web. Hola, a ver, les explicaré que es lo que quiero hacer aunque no se si es posible hacerlo con php. Verán, necesito hacer un script ...
  #1 (permalink)  
Antiguo 28/02/2003, 11:51
 
Fecha de Ingreso: agosto-2002
Mensajes: 139
Antigüedad: 15 años, 3 meses
Puntos: 0
Leer y examinar páginas.

Hola, a ver, les explicaré que es lo que quiero hacer aunque no se si es posible hacerlo con php.

Verán, necesito hacer un script que examine una página web y devuelva todas las palabras que contengan una cadena determinada. Por ejemplo:

un scipt que me examine http://www.ya.com y me devuelva todas las palabras que contengan la cadena 'max'. Como les dije no tengo ni idea de si esto es posible con PHP, si no saben como hacerlo con PHP pero se les ocuirre forma en otro lenguaje como ASP diganmelo también.

Si sabeis solo como hacer parte de mi pregunat decidmelo también.

Muchas Gracias.
  #2 (permalink)  
Antiguo 28/02/2003, 13:47
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 15 años, 11 meses
Puntos: 126
Se puede en PHP solo es cosa de ver un poco que necesitas y buscar las funciones adecuadas ...

Necesitas:
1) .. Abrir el HTML externo en modo lectura hacia un string (cadena):

2) buscar esa palabra como "pattern" del string que contiene todo el HTML de esa página que hemos abierto en el punto 1.

Código PHP:
<?PHP
function buscar_en_url($url,$cadena_buscar){
  
$url_en_cadena=implode('',file($url)); // leer todo el URL sobre un string (cadena)
  
preg_match_all("/$cadena_buscar/i",$url_en_cadena,$coincidencias_array); // Expresión regular en Perl (primer parámetro) .. el i indica no sensible a mayusculas/minusculas
  
return count($coincidencias_array[0]); // se cuenta el array generado por las coincidencias encontradas.
}

// su uso:
$total_coincidencias=buscar_en_url("http://www.php.net","php");

echo 
"Total coincidencias: ".$total_coincidencias;
?>
Observaciones:
Esta rutina es muyy básica .. la cadena a buscar se busca en todo el HTML (contenido y entre los tag HTML ..) si solo quiers que "busque esas coincidencias" entre el contendido de esa página (todo lo q esté fuera de < ... > habría q "limpiar" antes el código .. Podrias hacerlo con otra expresión regular u otras funciones ..


Un saludo,

Última edición por Cluster; 28/02/2003 a las 13:50
  #3 (permalink)  
Antiguo 28/02/2003, 15:56
 
Fecha de Ingreso: agosto-2002
Mensajes: 139
Antigüedad: 15 años, 3 meses
Puntos: 0
De acuerdo Gracias.

Muchísimas gracias, perfecto, de verdad.
Justo lo q buscaba
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 09:49.