Ver Mensaje Individual
  #1 (permalink)  
Antiguo 12/09/2013, 01:28
neofilo
 
Fecha de Ingreso: abril-2012
Ubicación: Madrid (España)
Mensajes: 162
Antigüedad: 12 años
Puntos: 5
Robot de busquedas interno

Hola a todos, quizas este no sea el mejor lenguaje para hacer esto, pero es el unico que mas o menos controlo un poco.

Estoy tratando de hacer un pqueño robot de busqueda para usar en mi intranet.

Tenemos unos 100 archivos HTML en los que las personas van poniendo cosas de su trabajo, mi interes es leer esos 100 archivos y almacenar en una base de datos 2 Cosas:
1) la URL de esa pagina (Ej. 192.168.1.5/archivo.html, 192.168.1.5/archivo2.html...)
2) Los E-Mails que encuentre (Si encuentra una dirección de Email en alguna de las paginas lo mete en una base de datos de E-Mails.

Se que el punto 2 tiene que haber algún ejemplo ya echo incluso pero no lo he encontrado.

A ver si me pueden echar una mano, podría ser un programita interesante.