no mas bien lo que quiero hacer es, ya habiendo obtenido el codigo HTM este poder analizarlo, algo asi como si fuera una indexacion de la informacion, pero esto ya que se obtenga el HTML.
ejemplo:
<HTML>
<body>
.
.
.
<a href="x">liga</a>
</body>
</html>
en el codigo anterior lo que quiero hacer es poder saber que palabra dice entre los tags <a></a>, es como leer XML pero de una pagina HTML ya ejecutada, osea ya mostrada la informacion despues de la interpretacion, suponiendo que sea una pagina PHP.
Espero haber sido mas especifico