Foros del Web » Programando para Internet » PHP »

[SOLUCIONADO] Problema manejando HTML

Estas en el tema de Problema manejando HTML en el foro de PHP en Foros del Web. Buenos días basicamente lo que hago es: Obtengo un archivo vía file_get_contents y lo guardo como .html o .txt Lo que quiero hacer es de ...
  #1 (permalink)  
Antiguo 01/02/2015, 19:36
Avatar de perrucis  
Fecha de Ingreso: septiembre-2011
Mensajes: 24
Antigüedad: 12 años, 7 meses
Puntos: 1
Problema manejando HTML

Buenos días basicamente lo que hago es: Obtengo un archivo vía file_get_contents y lo guardo como .html o .txt

Lo que quiero hacer es de ese archivo buscar ciertas palabras vía strpos:

Código PHP:

<?PHP

$doc 
fopen"text.html""r" ); 
$cont fread($docfilesize("text.html")); 

buscaArt();

function 
buscaArt()
    {
        global 
$cont;
        
$pos strpos($cont"Artículos 1 - 16");
        
        if(
$pos === false)
        {
        echo 
"error"
        }
        else
        {
        echo 
"Éxito";
        }
    }
?>
Así obtengo el html:

Código PHP:


<?PHP
        
        $string 
file_get_contents("url");
        
        if (
$string == false)
        {
            print 
"<h1>Error</h1>";
        }
        
        
$archivo fopen("text.html""w");
        
fwrite($archivo$string);
        
        
?>

El problema que tengo es que jamás encuentro el string que busco, jamás lo encuentra, me encuentra la palabra "Artículos" sola, pero junta no, creo que es un problema con el formato nisiquiera cuando la guardo en .txt y lo busco con el bloc de notas puedo encontrarla, supongo que el formato en el que se guarda influye

Realmente no se que me falla, supongo que debe de ser algo con utf-8 o algo así

Ojalá alguien pueda ayudarme, gracias

Adjunto el .txt con esa parte que dice "Artículos 1 - 16"

http://www.mediafire.com/view/aengl63377vldnv/text.txt
  #2 (permalink)  
Antiguo 02/02/2015, 07:03
 
Fecha de Ingreso: enero-2015
Mensajes: 205
Antigüedad: 9 años, 3 meses
Puntos: 18
Respuesta: Problema manejando HTML

El fichero que has subido a media fire tiene puesto esto

Código HTML:
Ver original
  1. <div class="locationitem locationitem_left">    
  2.                                                                                                                                             Artículos
  3. 1
  4. -
  5. 16
  6. de
  7. 103
  8. </div>

Y los saltos de linea y tabulaciones no te los encuentra, obviamente no es igual.


Si lo cambías y pones esto a mi me funciona bien.


Código HTML:
Ver original
  1. <div class="listlocator listlocatortop clear">
  2. <div class="locationitem locationitem_left">    
  3. Artículos 1 - 16
  4. de
  5. 103
  6. </div>
  7. <div class="locationitem locationitem_right">                        
  8. <div class="emsort_title">Ordenar por:</div>
  9. <div id="emselectbox_sort" class="emselectbox emselectbox_sort">
  #3 (permalink)  
Antiguo 02/02/2015, 07:04
 
Fecha de Ingreso: enero-2015
Mensajes: 205
Antigüedad: 9 años, 3 meses
Puntos: 18
Respuesta: Problema manejando HTML

Ábrelo con ultraedit o con editores de texto de programación, no con el notepad que no lo verás, lo que te comento

saludos
  #4 (permalink)  
Antiguo 02/02/2015, 11:08
Avatar de ArturoGallegos
Moderador
 
Fecha de Ingreso: febrero-2008
Ubicación: Morelia, México
Mensajes: 6.774
Antigüedad: 16 años, 2 meses
Puntos: 1146
Respuesta: Problema manejando HTML

Aquí nos da flojera descargar archivos mejor tomate tu la molestia de pegar el contenido aquí para que lo veamos.... da las gracias que @Nedned se dio a la tarea de descargar dicho archivo, pocos lo aran y te ignoraran porque no estamos para eso, quieres ayuda... coloca aquí todo el código necesario para las pruebas.

Aunque he de coincidir con el compañero y jugando a las adivinanzas, el problema pueden ser los saltos de linea... usa preg_match y una expresión regular para encontrar lo que buscas, sera mas rápido y fácil.
  #5 (permalink)  
Antiguo 02/02/2015, 18:18
Avatar de perrucis  
Fecha de Ingreso: septiembre-2011
Mensajes: 24
Antigüedad: 12 años, 7 meses
Puntos: 1
Respuesta: Problema manejando HTML

Cita:
Iniciado por Nedned Ver Mensaje
Ábrelo con ultraedit o con editores de texto de programación, no con el notepad que no lo verás, lo que te comento

saludos


Muchas gracias, al final terminé añadiendo:

Código PHP:
$newHtml preg_replace('/\s+|\n|\t/'''$html); 
y me quité de problemas con los espacios y tabulaciones molestas, gracias en serio :)

Etiquetas: html
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 21:54.