Foros del Web » Programando para Internet » PHP »

Indexacion de archivos

Estas en el tema de Indexacion de archivos en el foro de PHP en Foros del Web. Hola a todos: Creo que puede ser un tema que puede agradar a varios. Estoy en la busqueda de algun buen articulo acerca de la ...
  #1 (permalink)  
Antiguo 18/07/2006, 00:02
Avatar de mauled  
Fecha de Ingreso: marzo-2005
Ubicación: Cd. de México.
Mensajes: 3.001
Antigüedad: 12 años, 9 meses
Puntos: 33
Exclamación Indexacion de archivos

Hola a todos:

Creo que puede ser un tema que puede agradar a varios.

Estoy en la busqueda de algun buen articulo acerca de la indexacion de archivos. Hago esta pregunta en este foro, puesto que el procedimiento se tendria que hacer del lado del servidor.

He visto que existen varios programas que ya lo hacen, pero pues no tendria ningun sentido usarlo si no se entiende realmente como funciona.

Espero que alguien pueda orientarme.


Gracias.
  #2 (permalink)  
Antiguo 18/07/2006, 09:08
Avatar de mauled  
Fecha de Ingreso: marzo-2005
Ubicación: Cd. de México.
Mensajes: 3.001
Antigüedad: 12 años, 9 meses
Puntos: 33
Exclamación

ayuda porfavor!!!
  #3 (permalink)  
Antiguo 18/07/2006, 09:53
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 15 años, 11 meses
Puntos: 126
No conozco tutorial especifico sobre el tema .. además que el concepto de "indexación" no es própio de PHP .. (por si quieres buscar información al respecto).

En líneas generales, la "indexación" (tal vez ya lo sepas .. pero por si a caso) .. se trata de un proceso tipo:

1) Recorrer estructura del sitio (directorios desde uno dado en forma recursiva). Buscando sólo las páginas con extensiones determinadas.

2) Aplicar expresiones regulares a la página para:
2.1) Limpiar de código HTML/javascript y así quedarse con el contenido en sí de la página.
2.2) Quitar o filtrar palabras de menos de 3 caracteres (suelen hacer eso).

3) "Indexar" .. Tomar esas "palabras" por página que se filtranon y evaluar n° de repeticiones (no sé el algorítmo a emplear exactamente ..). Almacenar las palabras encontradas en una BBDD (normalmente) unicas y ortorgar "relevancia" (n° de veces que aparece, para las busquedas poder ordenar los resultados por este criterio) y relacionar en la página que apareció (URL/nombre).

Basicamente es como implementaría un "indexador" o más o menos como he visto por encima como trabajan .. Seguramenten exiten mejores formas de tratar el tema ..

Un saludo,
__________________
Por motivos personales ya no puedo estar con Uds. Fue grato haber compartido todos estos años. Igualmente los seguiré leyendo.
  #4 (permalink)  
Antiguo 18/07/2006, 09:54
 
Fecha de Ingreso: septiembre-2003
Ubicación: lima
Mensajes: 378
Antigüedad: 14 años, 2 meses
Puntos: 0
Asi como planteas tu pregunta nadie te entiende se mas especifico
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 04:44.