Foros del Web » Programando para Internet » PHP »

Se puede crear un Buscador de contenidos para archivos PDF?

Estas en el tema de Se puede crear un Buscador de contenidos para archivos PDF? en el foro de PHP en Foros del Web. Se puede crear un Buscador de contenidos para archivos PDF y que se pueda buscar por Titulo y contenido?. Logicamente esto deben estar almacenados en ...
  #1 (permalink)  
Antiguo 17/08/2004, 12:12
 
Fecha de Ingreso: febrero-2002
Mensajes: 82
Antigüedad: 15 años, 10 meses
Puntos: 0
Se puede crear un Buscador de contenidos para archivos PDF?

Se puede crear un Buscador de contenidos para archivos PDF y que se pueda buscar por Titulo y contenido?.
Logicamente esto deben estar almacenados en una DB mysql. De ser así, cómo defino la tabla?.

Gracias....
__________________
Para que el mundo sea bueno, debe ser bueno para todos.....
  #2 (permalink)  
Antiguo 17/08/2004, 12:16
Avatar de el_cesar  
Fecha de Ingreso: mayo-2001
Ubicación: Cali
Mensajes: 2.411
Antigüedad: 16 años, 6 meses
Puntos: 20
se me ocurre que esto se podria trabajar con gestion de archivos, es decir como si fueras a trabajar con un txt, es posible esto???? o es muy descabellado
__________________
Say no more.......
  #3 (permalink)  
Antiguo 17/08/2004, 13:58
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 15 años, 11 meses
Puntos: 126
Lo peor de buscar en un "PDF" es que hay que "parsearlo" (limpiarlo de sus códigos própios) si es que no está de alguna manera "codificado/encriptado" ...

Ahora .. ese "PDF" en sí .. puedes tenerlo igualmente en tu sistema de archivos y en tu BD sólo guardar la referencia del nombre del .pdf .. o bien lo incluyees en un campo de tu BD todo el PDF en forma "binária" .. En ambos casos existe el mismo problema de "parsear" ese PDF a no ser que uses alguna apliación externa (algún lector de PDF) que se controle por línea de comandos (Shell) o por COM (para windows) y no sé como o que devolverá si encuentra el término que buscas.

Lo más "sano" (pero no exacto 100%) es que hagas un bréve resumen del contenido del PDF y tal vez hasta un campo más extra donde guardes "palabras clave" como para buscar en esa descripción y "palabras clave" ..

Un saludo,
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 23:10.