Ver Mensaje Individual
  #3 (permalink)  
Antiguo 12/06/2014, 16:07
Avatar de NSD
NSD
Colaborador
 
Fecha de Ingreso: mayo-2012
Ubicación: Somewhere
Mensajes: 1.332
Antigüedad: 12 años
Puntos: 320
Respuesta: indexar pdf's

Si usas ubuntu (o cualquier distro de linux) puedes usar grep con el paquete poppler-utils que por supuesto, al igual que el sistema operativo, es totalmente gratuito.
En un directorio del servidor, tendrias una carpeta con documentos de word, pdfs, xml, texto, etc y podrias usar este comando para buscar un texto en estos archivos.

Aqui hay un ejemplo de como usar grep y de como instalar el paquete poppler-utils.

Luego que eso lo tengas funcionando, puedes usar las Funciones de ejecucion de programas desde php para llamar a grep, realizar la busqueda y retornar los resultados.

Edito: aparentemente se puede hacer tambien con windows con el paquete xpdf o bien, una extencion de este, llamada pdfsearch la cual hace exactamente lo que tu quieres.
Esta hecha en phyton no en php, y presenta 3 interfaces, la de la linea de comando (para llamar desde php, pero no hace falta), la de escritorio que tiene una gui simple, y una servidor que te permite acceder por la web. La aplicacion sola indexa busquedas y demas asi que eso ya o tendrias resuelto.
__________________
Maratón de desafíos PHP Junio - Agosto 2015 en FDW | Reglamento - Desafios

Última edición por NSD; 13/06/2014 a las 11:07