puedes usar las
funciones regulares para encontrar expresiones en una cadena.
si quieres algo mas sotisficado tambien puedes usar la libreria:
XML Parser Functions. es mas dificil de usar pero a la larga un mejor instrumento para analizar documentos XML (en particular XHTML).
$str = file_get_contents("http://www.loquesea.com/documento.html") para extraer el contenido y guardarlo en la variable $str.