Foros del Web » Programando para Internet » PHP »

file_get_contents excluir etiquetas

Estas en el tema de file_get_contents excluir etiquetas en el foro de PHP en Foros del Web. Hola!!! Necesitaria obtener el contenido de una pagina que esta adentro de body con file_get_contents, pero necesito excluir todo lo que sean etiquetas, o sea ...
  #1 (permalink)  
Antiguo 25/09/2007, 18:35
 
Fecha de Ingreso: junio-2006
Mensajes: 37
Antigüedad: 17 años, 10 meses
Puntos: 0
file_get_contents excluir etiquetas

Hola!!!

Necesitaria obtener el contenido de una pagina que esta adentro de body con file_get_contents, pero necesito excluir todo lo que sean etiquetas, o sea p, a, br, etc. o sea, el texto puro necesito.

Se que tendria que filtrar con una expresion regular, pero no me sale!

Alguno que sepa? gracias!!!
  #2 (permalink)  
Antiguo 25/09/2007, 19:52
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Re: file_get_contents excluir etiquetas

Primero obtenés el contenido del archivo con file_get_contents.

Luego, cortás el contenido entre body y /body con combinaciones de substr/strpos (cortar desde el lugar en el que strpos encuentra el "<body>" hasta que se encuentra el "</body>".

Y para terminar, simplemente usás strip_tags con la cadena que te quedó.


Saludos.
  #3 (permalink)  
Antiguo 26/09/2007, 13:24
Avatar de Seppo  
Fecha de Ingreso: marzo-2005
Ubicación: Buenos Aires, Argentina
Mensajes: 1.284
Antigüedad: 19 años, 1 mes
Puntos: 17
Re: file_get_contents excluir etiquetas

Como dice alvlin, pero en vez de hacerlo desde "<body>" lo haría desde "<body", por si tiene algún atributo... =)
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 22:12.