Ver Mensaje Individual
  #1 (permalink)  
Antiguo 13/02/2013, 06:36
Avatar de BaKuSiN
BaKuSiN
 
Fecha de Ingreso: mayo-2010
Mensajes: 5
Antigüedad: 14 años
Puntos: 0
Pregunta Problema al Extraer texto de un PDF

Buenas,
necesito leer una tabla de un PDF, he conseguido hacerlo desde pdftohtml en linux, pero me surge el problema que lo lee de tal forma que si el texto esta partido en dos lineas en una misma celda, lo cuenta como si fuese una linea anterior y no lo junta con la palabra que le sigue (no se si me estoy explicando bien), basicamente que de una fila llega a interpretar 3 lineas distintas.



Lo que necesito es alguna libreria en php (o si sabeis algun programa para pasarle una linea de comandos en linux/windows tambien me sirve), para extraer un texto de un pdf y que mantenga la tabla tal cual con algun separador o algo, para que pueda manipular los datos.




Muchas Gracias!