Foros del Web » Programando para Internet » PHP »

Spider simple

Estas en el tema de Spider simple en el foro de PHP en Foros del Web. Hola, estoy haciendo un spider que extaiga urls de un sitio y titulos pero no doy con las funciones adecuadas, alguien podria guiarme que funciones ...
  #1 (permalink)  
Antiguo 06/03/2008, 01:36
Avatar de hawaiian050  
Fecha de Ingreso: junio-2007
Mensajes: 285
Antigüedad: 16 años, 9 meses
Puntos: 2
Información Spider simple

Hola, estoy haciendo un spider que extaiga urls de un sitio y titulos pero no doy con las funciones adecuadas, alguien podria guiarme que funciones variable o classes comandos podria usar es que soy nuevo en esto.

bueno muchas gracias un saludo grande
  #2 (permalink)  
Antiguo 06/03/2008, 05:39
Avatar de farra  
Fecha de Ingreso: marzo-2008
Ubicación: Aqui estoy
Mensajes: 574
Antigüedad: 16 años
Puntos: 20
De acuerdo Re: Spider simple

Código PHP:
<?php
$the_url 
= isset($_REQUEST['url']) ? htmlspecialchars($_REQUEST['url']) : '';
?>

<form method="post">
  Escribe la direccion URL completa de la pagina a extraer (incluyendo http://):<br />
  <input type="text" name="url" size="65" value="<?php echo $the_url;  ?>"/><br />
  <br />
  <br />
  <input type="submit" value="Parse Emails" />
</form>

<?php
if (isset($_REQUEST['url']) && !empty($_REQUEST['url'])) {
  
// fetch data from specified url
  
$text file_get_contents($_REQUEST['url']);
}
// parse emails
if (!empty($text)) {
  
$res preg_match_all(
    
"/[a-z0-9]+([_\\.-][a-z0-9]+)*@([a-z0-9]+([\.-][a-z0-9]+)*)+\\.[a-z]{2,}/i",
    
$text,
    
$matches
  
);

  if (
$res) {
    foreach(
array_unique($matches[0]) as $email) {
      echo 
$email "<br />";
    }
  }
  else {
    echo 
"No emails found.";
  }
}

?>
  #3 (permalink)  
Antiguo 06/03/2008, 21:06
Avatar de hawaiian050  
Fecha de Ingreso: junio-2007
Mensajes: 285
Antigüedad: 16 años, 9 meses
Puntos: 2
Re: Spider simple

Cita:
Iniciado por farra Ver Mensaje
Código PHP:
<?php
$the_url 
= isset($_REQUEST['url']) ? htmlspecialchars($_REQUEST['url']) : '';
?>

<form method="post">
  Escribe la direccion URL completa de la pagina a extraer (incluyendo http://):<br />
  <input type="text" name="url" size="65" value="<?php echo $the_url;  ?>"/><br />
  <br />
  <br />
  <input type="submit" value="Parse Emails" />
</form>

<?php
if (isset($_REQUEST['url']) && !empty($_REQUEST['url'])) {
  
// fetch data from specified url
  
$text file_get_contents($_REQUEST['url']);
}
// parse emails
if (!empty($text)) {
  
$res preg_match_all(
    
"/[a-z0-9]+([_\\.-][a-z0-9]+)*@([a-z0-9]+([\.-][a-z0-9]+)*)+\\.[a-z]{2,}/i",
    
$text,
    
$matches
  
);

  if (
$res) {
    foreach(
array_unique($matches[0]) as $email) {
      echo 
$email "<br />";
    }
  }
  else {
    echo 
"No emails found.";
  }
}

?>
Gracias por tu aydua colega , pero este script es un bot extractor de mails de una url , lo que yo queria hacer es extraer las url de un sitio y sus titulos.

ese cod que pusistes lo hicistes tu? esta muy bueno me encanta.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta

SíEste tema le ha gustado a 1 personas




La zona horaria es GMT -6. Ahora son las 14:15.