Ver Mensaje Individual
  #1 (permalink)  
Antiguo 05/10/2011, 08:02
fermdp
 
Fecha de Ingreso: diciembre-2001
Ubicación: Mar del Plata
Mensajes: 203
Antigüedad: 22 años, 4 meses
Puntos: 0
Como extraer secciones de texto de un html o txt?

Buenas amigos! Tengo un problema y es que no puedo dar con la resolución del siguiente problema. necesito crear un .php que pueda tomar un archivo .html ó .txt como el citado aquí abajo y extraer todo lo que esta entre los caracteres "##" de modo que pueda con el resultado generar un archivo .txt que quede de la siguiente manera:

archivo.html ó archivo.txt:

Código HTML:
<HTML>
<HEAD>
<META NAME="GENERATOR "CONTENT="ENPS">
<META CONTENT="text/html;charset=utf-16" http-equiv=Content-Type>
<TITLE>TELEOCHO SEGUNDA</TITLE>
</HEAD>
<BODY BGPROPERTIES=FIXED>
<A NAME=StoryIndex>
<CENTER>
<H2>TELEOCHO SEGUNDA</H2>
<A HREF="teleocho segunda 4-10 vale.html">Click here for a full graphical version of this page</A><BR>
</CENTER>
<UL>
<LI><A HREF=#IMAGEN ESCUELA ATACADA-COLAS>IMAGEN ESCUELA ATACADA-COLAS</A>
<LI><A HREF=#VENTA 1 NUEVO RECLAMO-COLAS>VENTA 1 NUEVO RECLAMO-COLAS</A>
<LI><A HREF=#VENTA 2 QUEJAS EN LA ESTACION-COLAS>VENTA 2 QUEJAS EN LA ESTACION-COLAS</A>
<LI><A HREF=#VENTA 3 FINAL DE LOS JUEGOS-COLAS>VENTA 3 FINAL DE LOS JUEGOS-COLAS</A>
<LI><A HREF=#24429 ESCUELA ATACADA-INTRO>24429 ESCUELA ATACADA-INTRO</A>
<LI><A HREF=#24419 ENTREGA ARMAS EL GAUCHO OFF VIVO-INTRO>24419 ENTREGA ARMAS EL GAUCHO OFF VIVO-INTRO</A>
<LI><A HREF=#244428 SIMBOLO DE VICTIMAS-INTRO>244428 SIMBOLO DE VICTIMAS-INTRO</A>
<LI><A HREF=#24418 JUICIO QUEMADA-INTRO>24418 JUICIO QUEMADA-INTRO</A>
<LI><A HREF=#24417 MENORES ENTREGADOS-INTRO>24417 MENORES ENTREGADOS-INTRO</A>
<LI><A HREF=#CHORRO FACEBOOK-VTR>CHORRO FACEBOOK-VTR</A>
<LI><A HREF=#CHORRO FACEBOOK-INTRO>CHORRO FACEBOOK-INTRO</A>
<LI><A HREF=#MOVIL SOBRERO-INTRO>MOVIL SOBRERO-INTRO</A>
<LI><A HREF=#MOVIL SOBRERO-VIVO>MOVIL SOBRERO-VIVO</A>
<LI><A HREF=#POLLO LIBERADO-INTRO>POLLO LIBERADO-INTRO</A>
<LI><A HREF=#POLLO LIBERADO-VTR>POLLO LIBERADO-VTR</A>
<LI><A HREF=#24427 SCOLA EN BONAERENSES-INTRO>24427 SCOLA EN BONAERENSES-INTRO</A>
<LI><A HREF=#24425 ALQUILERES COMERCIOS-INTRO>24425 ALQUILERES COMERCIOS-INTRO</A>
<LI><A HREF=#24426 COMPACTO ELECCIONES-INTRO>24426 COMPACTO ELECCIONES-INTRO</A>
<LI><A HREF=#24416 TORNEOS ABUELOS-INTRO>24416 TORNEOS ABUELOS-INTRO</A>
<LI><A HREF=#24415 TREN ROTO-INTRO>24415 TREN ROTO-INTRO</A>
<LI><A HREF=#24414 ENERGIA EOLICA-INTRO>24414 ENERGIA EOLICA-INTRO</A>
<LI><A HREF=#24413 MICRO KALERGUIZ-INTRO>24413 MICRO KALERGUIZ-INTRO</A>
</UL>
<HR>
</CENTER><HR><BR>
<A NAME=IMAGEN ESCUELA ATACADA-COLAS>
<H3>IMAGEN ESCUELA ATACADA-COLAS</H3><BR></DIV><DIV DIR=LTR>
<P>##IMAGEN
<P>ESCUELA ATACADA
<P>##


<FONT 000000 SIZE=-2><A HREF=#StoryIndex>Return to index of stories...</FONT></A><BR CLEAR=LEFT>
<HR></DIV>
<A NAME=VENTA 1 NUEVO RECLAMO-COLAS>
<H3>VENTA 1 NUEVO RECLAMO-COLAS</H3><BR></DIV><DIV DIR=LTR>
<P>##VENTA 1
<P>NUEVO RECLAMO
<P>##


<FONT 000000 SIZE=-2><A HREF=#StoryIndex>Return to index of stories...</FONT></A><BR CLEAR=LEFT>
<HR></DIV>
<A NAME=VENTA 2 QUEJAS EN LA ESTACION-COLAS>
<H3>VENTA 2 QUEJAS EN LA ESTACION-COLAS</H3><BR></DIV><DIV DIR=LTR>
<P>##VENTA 2
<P>QUEJAS EN LA ESTACIÓN
<P>##


</BODY>
</HTML> 

resultado deseado en resultado.txt:

Cita:
##IMAGEN
ESCUELA ATACADA
##

##VENTA 1
NUEVO RECLAMO
##

##VENTA 2
QUEJAS EN LA ESTACIÓN
##
Desde ya muchas gracias! Estóy empantanado o me perdí con la solución y no se para donda apuntar!!!
__________________
:) Fernando Dichiera (:
[email protected]