Ver Mensaje Individual
  #2 (permalink)  
Antiguo 26/04/2004, 09:43
Cluster
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 22 años, 3 meses
Puntos: 129
El funcionamiento de ese tipo de buscadores es de tipo "spider" en su base.

Sería algo así:

1) lees la estructura de directorios de tu servidor (o ramas a buscar archivos en el). (con dir() de PHP y funciones afines puedes hacerlo)

2) abres cada archivo y "limpias" de código (todo lo que está entre < y >) para quedarte con el contendido en sí. Esto se solventa con una pequeña expresión regular (si hablamos que el contenido a ser buscado está entre código HTML .. sino salta este punto pero habría que ver la estructura de datos de eso .txt planos).

3) aplicas funciones de expresiones regulares (y patrones) y buscas tu dato en el texto (para entonces ya lo tendras en una variable) que contiene el contenido a buscar. Te almacenas en algún sitio: session, archivo de texto plano .. etc Los resultados (por lo menos el nombre de la página que se encontró lo buscado).

4) Presentas esos datos obtenidos (de tu sesión o archivo de texto plano con los resultados obtenidos.

Para aligerar las busquedas .. podrías crear indices del sistio (y más si la información no suele cambiar mucho) .. así las busquedas se harían sobre tu indice creado y .. el preso de creación del indice sólo lo harías cuando realmente se modifique algo en el sitio ..

Lo mejor de todo esto ... es que tienes muchos sistemas ya hechos que trabajan como describo (sobreo todo indexando las páginas). Y hasta podrías usar los API de google (lo malo es que limitan el nº de busquedas a realizar).

Revisa aplicaciones ya hechas por aquí:
http://www.hotscripts.com/PHP/Script...nes/index.html

Un saludo,
__________________
Por motivos personales ya no puedo estar con Uds. Fue grato haber compartido todos estos años. Igualmente los seguiré leyendo.