Ver Mensaje Individual
  #1 (permalink)  
Antiguo 04/11/2005, 07:58
FITIPALDI1983
 
Fecha de Ingreso: octubre-2005
Mensajes: 18
Antigüedad: 18 años, 6 meses
Puntos: 1
Funcion para quitar etiquetas html del codigo de una pagina

Bueno, ya abri un post preguntando por cosillas o ideas para ir haciendo un mini-buscador en php...

Ahora estoy un poco recuperando infomracion, scripts, etc... sobre, a partir del codigo html de una pagina, dividir la informacion de una pagina segun este dentro de una etiqueta <b>, <i>, <hx>, etc...

Tengo 2 dudas:

1.- Si no recuerdo mal, existia una funcion que a partir de un codigo html, quitaba las etiquetas y devolvia ese mismo codigo pero sin etiquetas... No recuerdo si era en php o javascript o que, pero yo creo que era php...
¿Sabeis que funcion es?


2.- Que ideas a grandes rasgos teneis para analizar el codigo html para sacar la informacion de cada etiqueta teniendo en cuenta que:

Lo ideal seria que el coidgo viniera:
<p><b>El Ministerio de Agricultura</b> es uno de los ministerios de España</p>
<p> A veces alli hay ...</p>

Pero en realidad vienen los codigos de muchas paginas como:
<p><b>El Ministerio de Agricultura es uno de los ministerios de España
<p>A veces alli hay ...</p>

Vamos, que hay etiquetas sin cerrar, se abre un parrafo sin que se haya cerrado el anterior, etc...



Merci