Foros del Web » Programando para Internet » PHP »

indexar pdf's

Estas en el tema de indexar pdf's en el foro de PHP en Foros del Web. Hola, tengo una intranet en la que necesito hacer un buscador en el que se pueda buscar el texto dentro de los pdf, encontre "Zoom ...
  #1 (permalink)  
Antiguo 12/06/2014, 13:00
 
Fecha de Ingreso: abril-2014
Mensajes: 141
Antigüedad: 10 años
Puntos: 1
indexar pdf's

Hola, tengo una intranet en la que necesito hacer un buscador en el que se pueda buscar el texto dentro de los pdf, encontre "Zoom Search Engine" pero solo me muestra 4 resultados por busqueda y algunas veces al indexar los archivos el programa se detiene. El programa me hace solo el buscador en php yo solo lo tengo que adaptarlo a la web.

Me prodrian ayudar con algun otro programa que sea gratis o barato.

perdon pero no supe donde poner el tema
  #2 (permalink)  
Antiguo 12/06/2014, 13:28
Avatar de hhs
hhs
Colaborador
 
Fecha de Ingreso: junio-2013
Ubicación: México
Mensajes: 2.995
Antigüedad: 10 años, 9 meses
Puntos: 379
Respuesta: indexar pdf's

Creo que esto debe de ir en el foro de aplicaciones prefabricadas.
__________________
Saludos
About me
Laraveles
A class should have only one reason to change.
  #3 (permalink)  
Antiguo 12/06/2014, 16:07
Avatar de NSD
NSD
Colaborador
 
Fecha de Ingreso: mayo-2012
Ubicación: Somewhere
Mensajes: 1.332
Antigüedad: 11 años, 11 meses
Puntos: 320
Respuesta: indexar pdf's

Si usas ubuntu (o cualquier distro de linux) puedes usar grep con el paquete poppler-utils que por supuesto, al igual que el sistema operativo, es totalmente gratuito.
En un directorio del servidor, tendrias una carpeta con documentos de word, pdfs, xml, texto, etc y podrias usar este comando para buscar un texto en estos archivos.

Aqui hay un ejemplo de como usar grep y de como instalar el paquete poppler-utils.

Luego que eso lo tengas funcionando, puedes usar las Funciones de ejecucion de programas desde php para llamar a grep, realizar la busqueda y retornar los resultados.

Edito: aparentemente se puede hacer tambien con windows con el paquete xpdf o bien, una extencion de este, llamada pdfsearch la cual hace exactamente lo que tu quieres.
Esta hecha en phyton no en php, y presenta 3 interfaces, la de la linea de comando (para llamar desde php, pero no hace falta), la de escritorio que tiene una gui simple, y una servidor que te permite acceder por la web. La aplicacion sola indexa busquedas y demas asi que eso ya o tendrias resuelto.
__________________
Maratón de desafíos PHP Junio - Agosto 2015 en FDW | Reglamento - Desafios

Última edición por NSD; 13/06/2014 a las 11:07

Etiquetas: indexar
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 01:27.