Ver Mensaje Individual
  #1 (permalink)  
Antiguo 14/11/2008, 08:54
sciutomaxi
 
Fecha de Ingreso: junio-2007
Mensajes: 152
Antigüedad: 16 años, 10 meses
Puntos: 0
Obtener texto de un Pdf

Hola amigos necesito obtener los primeros 256 caracteres de un archivo pdf. Busque y no hay nada.
Pense tratar de convertir el pdf a texto plano pero tampoco conseguí convertir un pdf a texto plano.
Lo unico que encontre que anda mas o menos es una clase que busca palabras en los pdf pero anda mas o menos esta es la clase su creado es Rene Kluwen

Código PHP:
<?

/**********************************************************************
**
** A class to search text in pdf documents.
** Not pretending to be useful other than that.
** But it can easily be extended to a full featured pdf document
** parser by anyone who chooses so.
**
** Author: Rene Kluwen / Chimit Software <[email protected]>
**
** License: Public Domain
** Warranty: None
**
***********************************************************************/

class pdf_search {

        
// Just one private variable.
        // It holds the document.
        
var $_buffer;

        
// Constructor. Takes the pdf document as only parameter
        
function pdf_search($buffer) {
                
$this->_buffer $buffer;
        }

        
// This function returns the next line from the document.
        // If a stream follows, it is deflated into readable text.
        
function nextline() {
                
$pos strpos($this->_buffer"\r");
                if (
$pos === false) {
                        return 
false;
                }
                
$line substr($this->_buffer0$pos);
                
$this->_buffer substr($this->_buffer$pos 1);
                if (
$line == "stream") {
                        
$endpos strpos($this->_buffer"endstream");
                        
$stream substr($this->_buffer1$endpos 1);
                        
$stream = @gzuncompress($stream);
                        
$this->_buffer $stream substr($this->_buffer$endpos 9);
                }
                return 
$line;
        }

        
// This function returns the next line in the document that is printable text.
        // We need it so we can search in just that portion.
        
function textline() {
                
$line $this->nextline();
                if (
$line === false) {
                        return 
false;
                }
                if (
preg_match("/[^\\\\]\\((.+)[^\\\\]\\)/"$line$match)) {
                        
$line preg_replace("/\\\\(\d+)/e""chr(0\\1);"$match[1]);
                        return 
stripslashes($line);
                }
                return 
$this->textline();
        }

        
// This function returns true or false, indicating whether the document contains
        // the text that is passed in $str.
        
function textfound($str) {
                while ((
$line $this->textline()) !== false) {
                        if (
preg_match("/$str/i"$line) != 0) {
                                return 
true;
                        }
                }
                return 
false;
        }
}

?>
Alguno me puede dar una mano ya que no existe sobre obtener datos de un pdf con php
La idea es pasar el pdf a texto plano y listo, pero como hago para convertirlo a texto plano??

Última edición por sciutomaxi; 14/11/2008 a las 09:05