Foros del Web » Programando para Internet » PHP »

Buscador en Php - meta name="keywords"

Estas en el tema de Buscador en Php - meta name="keywords" en el foro de PHP en Foros del Web. Hola amigos del foro, bueno mí cuesntión es la siguiente, deseo realizar un buscador interno, para lo cual he averiguado y he encontrado que en ...
  #1 (permalink)  
Antiguo 12/07/2006, 10:32
 
Fecha de Ingreso: octubre-2005
Mensajes: 45
Antigüedad: 12 años, 2 meses
Puntos: 0
Pregunta Buscador en Php - meta name="keywords"

Hola amigos del foro, bueno mí cuesntión es la siguiente, deseo realizar un buscador interno, para lo cual he averiguado y he encontrado que en los meta se puede poner palabras clave, es decir, para identificar de que se trata la página, pero es que no entiendo primero como recojó los valores que están en los meta, segundo como abro o busco en los diferentes Html, que conforman mí web, bueno sé que se podría crear una base de datos con las palabras clave, pero a decri verdad me pidieron no hacer eso, ya que se quiere que no se tenga que actualizar la Base de datos cada vez que se ponga un nuevo contenido, por lo tanto sólo sería poner las palabras clave en los meta, y luego el script generado busque en todos los meta que existen en los diferentes Html's, y así me de los resultados del caso, no sé si fue claro en mí inquietud.

Cualquier ayuda que me puedan dar se les agradece mucho, de antemano gracias por la atención préstada.
  #2 (permalink)  
Antiguo 12/07/2006, 11:23
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 15 años, 11 meses
Puntos: 126
Cita:
pero a decri verdad me pidieron no hacer eso, ya que se quiere que no se tenga que actualizar la Base de datos cada vez que se ponga un nuevo contenido,
No se trata de buscar en todo el contenido de tu página . .sino en generar indices. El tema de que actualizar la BBDD cuando se ingresa un nuevo contenido se puede "disparar" en forma automática (depende como actualices ese contenido .. así se podrá automatizar más o menos).

Ahora .. las preguntas serían:

¿Por qué no queda todo tu contenido en una BBDD? .. así podrías buscar fácilmente usando SQL y más optimo que no abrir ficheros .. uno por uno . .recorrer estructura de directorios .. parsear el archivo .. etc .. etc ... En definitiva hablo de gestionar el contenido en sí como tal en BBDD y darle formato con HTML vía PHP para su presentación lo más posible.?

Bueno ... si quieres buscar en las cabeceras Meta de las páginas .. el proceso sería:
1) recorrer la estructura de directorios (si la hay .. o están todos en un mismo directorio? en busca de tus .html (o podrían ser también .php que generen html?)

2) "Parsear" el contenido para descartar todo código HTML y demás ..

3) entregar el resultado.

Como veras .. tomar un .html .. tener que procesarlo (con expresiones regulaes) y más encima volver a "parsearlo" para buscar en lo que resulte (con más expresiones regulares) no es una taréa "rápida" y podría hacer que colapse PHP (por tiempo de ejecución entre otras cosas).

Hay sistemas externos a PHP para tal fin (implementados en otros lenguajes) .. como por ejemplo:

htdig
http://www.htdig.org/
(tienes interfaces en PHP para usarlo ..)

Buscadores como los que comentas tienes también implementados en:
http://www.hotscripts.com/PHP/Script...nes/index.html

Hay muchos .. mira a ver cual te acomoda (no recuerdo el nombre de ninguno ahora que lo haga sólo por los "<meta>" sin generar indices ..pero es que realmente es más óptimo generar indices!!! .. Sólo te queraría discutir con tus "jefes" cuando disparar la generación del indice .. además que estos sistemas suelen atender a la última fecha de modificación .. así que no se trata de re-indexar todo el sitio .. el soft ya debe se lo bastante "inteligente" para saber que re-indexar ...)

(a veces no es necesario re-inventar la rueda .. sólo saber de que se trata lo que ya tienes hecho y saber que buscar).

Un saludo,
__________________
Por motivos personales ya no puedo estar con Uds. Fue grato haber compartido todos estos años. Igualmente los seguiré leyendo.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 15:23.