Ver Mensaje Individual
  #2 (permalink)  
Antiguo 12/07/2006, 10:23
Cluster
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 22 años, 3 meses
Puntos: 129
Cita:
pero a decri verdad me pidieron no hacer eso, ya que se quiere que no se tenga que actualizar la Base de datos cada vez que se ponga un nuevo contenido,
No se trata de buscar en todo el contenido de tu página . .sino en generar indices. El tema de que actualizar la BBDD cuando se ingresa un nuevo contenido se puede "disparar" en forma automática (depende como actualices ese contenido .. así se podrá automatizar más o menos).

Ahora .. las preguntas serían:

¿Por qué no queda todo tu contenido en una BBDD? .. así podrías buscar fácilmente usando SQL y más optimo que no abrir ficheros .. uno por uno . .recorrer estructura de directorios .. parsear el archivo .. etc .. etc ... En definitiva hablo de gestionar el contenido en sí como tal en BBDD y darle formato con HTML vía PHP para su presentación lo más posible.?

Bueno ... si quieres buscar en las cabeceras Meta de las páginas .. el proceso sería:
1) recorrer la estructura de directorios (si la hay .. o están todos en un mismo directorio? en busca de tus .html (o podrían ser también .php que generen html?)

2) "Parsear" el contenido para descartar todo código HTML y demás ..

3) entregar el resultado.

Como veras .. tomar un .html .. tener que procesarlo (con expresiones regulaes) y más encima volver a "parsearlo" para buscar en lo que resulte (con más expresiones regulares) no es una taréa "rápida" y podría hacer que colapse PHP (por tiempo de ejecución entre otras cosas).

Hay sistemas externos a PHP para tal fin (implementados en otros lenguajes) .. como por ejemplo:

htdig
http://www.htdig.org/
(tienes interfaces en PHP para usarlo ..)

Buscadores como los que comentas tienes también implementados en:
http://www.hotscripts.com/PHP/Script...nes/index.html

Hay muchos .. mira a ver cual te acomoda (no recuerdo el nombre de ninguno ahora que lo haga sólo por los "<meta>" sin generar indices ..pero es que realmente es más óptimo generar indices!!! .. Sólo te queraría discutir con tus "jefes" cuando disparar la generación del indice .. además que estos sistemas suelen atender a la última fecha de modificación .. así que no se trata de re-indexar todo el sitio .. el soft ya debe se lo bastante "inteligente" para saber que re-indexar ...)

(a veces no es necesario re-inventar la rueda .. sólo saber de que se trata lo que ya tienes hecho y saber que buscar).

Un saludo,
__________________
Por motivos personales ya no puedo estar con Uds. Fue grato haber compartido todos estos años. Igualmente los seguiré leyendo.