Foros del Web » Programación para mayores de 30 ;) » Bases de Datos General »

Estructura de Buscador

Estas en el tema de Estructura de Buscador en el foro de Bases de Datos General en Foros del Web. Saludos a todos Estoy desarrollando un proyecto bastante grande donde en el mismo hay que implementar un buscador, he leído algo sobre el tema y ...
  #1 (permalink)  
Antiguo 26/02/2008, 14:51
Avatar de alaintm  
Fecha de Ingreso: marzo-2007
Mensajes: 149
Antigüedad: 17 años, 1 mes
Puntos: 1
Estructura de Buscador

Saludos a todos

Estoy desarrollando un proyecto bastante grande donde en el mismo hay que implementar un buscador, he leído algo sobre el tema y la verdad que no se por donde enfilar el desarrollo del mismo. El proyecto es soportado sobre XHTML y PHP y no se que opción es más viable si crear una base de datos que me almacene las palabras más relevantes por página o leer dentro de cada archivo, en caso de emplear una base de datos que muchos se inclinan por esa vía cuantas tablas haría falta.

Agradezco de antemano su ayuda
  #2 (permalink)  
Antiguo 26/02/2008, 15:30
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Re: Estructura de Buscador

Si el buscador, tiene que buscar en varios archivos, lo mejor es tener un robot que lo que haga es leer esos archivos e indexarlos en una base de datos, así podrás hacer tu búsqueda sobre la base de datos y obtener los resultados.

Saludos.
  #3 (permalink)  
Antiguo 26/02/2008, 16:45
Avatar de alaintm  
Fecha de Ingreso: marzo-2007
Mensajes: 149
Antigüedad: 17 años, 1 mes
Puntos: 1
Re: Estructura de Buscador

Cuando te refiere a un robot es un script que lee el archivo y luego añada las palabras a la base de datos excluyendo artículos y signos de puntuación y me imagino que haga más énfasis en las que estén entre H1 -H6, pero mi duda es en la estructura de la Base de datos, sería una tabla con los siguientes campos: pagina, palabras todas en una mismo campo y así por cada página o existe una estructura más óptima porque e visto que emplean más de dos tablas y no entiendo el objetivo.
  #4 (permalink)  
Antiguo 26/02/2008, 16:49
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Re: Estructura de Buscador

Yo te recomendaria guardarlo en una sola tabla, y usar indices FULL TEXT de MySQL para indexar, asi podras obtener resultados por mayor relevancia.

Saludos.
  #5 (permalink)  
Antiguo 26/02/2008, 16:54
Avatar de jaronu  
Fecha de Ingreso: febrero-2008
Mensajes: 2.183
Antigüedad: 16 años, 2 meses
Puntos: 52
Re: Estructura de Buscador

Mejor usar Db de Mysql
lo de la cantidad de tablas depende de como quieras que esten de ordenados tus datos, los que quieres mostrar, solo has de adaptar los query a la base de datos para cada busqueda.
digamos que en la busqueda quieres mostrar libros, la tabla ha de ser:

isbn, titulo, categoria, descripicion,

haces un query a la base de datos para que te recupere esos libros de esas categorias o como quieras.

pero si tu intencion es hacer algo como google entonces haz lo que te han dicho del robot, que haga el trabajo por ti.

el diseño de una base de datos que funcione bien es algo complicado
de todas formas visita:

www.illasaron.com

te sorprendera su curso de php y MyQL
  #6 (permalink)  
Antiguo 27/02/2008, 09:02
Avatar de alaintm  
Fecha de Ingreso: marzo-2007
Mensajes: 149
Antigüedad: 17 años, 1 mes
Puntos: 1
Re: Estructura de Buscador

Les agradezco su ayuda, en estos momentos estoy desarrollando el robot y mi idea seria indexar primero las paginas, luego leer el contenido de cada pagina almacenar en la tabla los siguientes datos: descripcion, contenido segun la estructura o sea H1-H6 P, pero como puedo darles mas relevancia al contenido que este ente H1-H6 con respecto al resto al almacenar en la base de datos.

Salu2
  #7 (permalink)  
Antiguo 27/02/2008, 09:12
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Re: Estructura de Buscador

Puedes guardar en tu base de datos lo que este entre <h1> y <h6> en diferentes campos, así puedes ver la prioridad.

Saludos.
  #8 (permalink)  
Antiguo 27/02/2008, 10:07
Avatar de alaintm  
Fecha de Ingreso: marzo-2007
Mensajes: 149
Antigüedad: 17 años, 1 mes
Puntos: 1
Re: Estructura de Buscador

Haber si te entendi bien, creo campos para guardar por ejemplo los H1, otro para los H2 y susecivamente y los parrafos en otro y sin descuidar los meta keyword, pero al realizar la busqueda debe ser por cada campo, dando prioridad por la estructura al mostrar los resultados, me consumiria mucho recurso una busqueda asi?

Salu2
  #9 (permalink)  
Antiguo 27/02/2008, 10:26
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Re: Estructura de Buscador

Si te consumiría muchos recursos, ya que necesitarías de mucha información, y también de un servidor de bases de datos muy poderoso.

Saludos.
  #10 (permalink)  
Antiguo 27/02/2008, 10:51
Avatar de alaintm  
Fecha de Ingreso: marzo-2007
Mensajes: 149
Antigüedad: 17 años, 1 mes
Puntos: 1
Re: Estructura de Buscador

Entonces que estructura me recomiendas, solo guardo los H1-H6 y obvio el contenido, es que quiero hacerlo lo más óptimo posible, si conoces una estructura te agradecería la ayuda no es necesario el código ya que el desarrollo de este script es para mi desarrollo solo necesito una estructura lo más óptima posible.

salu2
  #11 (permalink)  
Antiguo 27/02/2008, 10:59
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Re: Estructura de Buscador

Te trasladado al foro de Bases de Datos para que te orienten mas en forma, en mi opinión si le quieres dar prioridad a los tags H1 al H6, si seria óptimo guardarlos en una celda aparte para así ver la relevancia.

Saludos.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 04:30.