Foros del Web - Ver Mensaje Individual - Obtener y analizar codigo fuente de una web en PHP

almensilla · #5 (**permalink**) 25/04/2011, 10:29

Ya se como obtener los h2

Código:

$html = file_get_contents('cualkierweb');
      $dom = new DOMDocument(); // creamos un nuevo documento
      @$dom->loadHTML($html); // cargamos el código html
      // obtenemos todo de la pagina
      $xpath = new DOMXPath($dom);
      $hrefs = $xpath->evaluate("//h2");
      for ($i = 0; $i <$hrefs->length; $i++) {
             $href = $hrefs->item($i);
             $res=$href->textContent;
             echo '<b>'.$res.'</b><br>';
      }

Hasta ahí perfecto, lo que pasa esque quiero complicar la cosa, y aqui me veo con muchas lagunas.

Imaginemos que tenemos una lista:

Código:

<ul>
   <h2>Titulo1</h2>
   <li>Algo1</li>
   <li>Algo2</li>
   <h2>Titulo2</h2>
   <li>Algo3</li>
   <li>Algo4</li>
</ul>

Como puedo hacer para obtener:

Titulo1
Algo1
Algo2

Titulo2
Algo3
Algo4

Si en el XPath escribo //ul lo q me devuleve es un string con todo el contenido junto, pero quiero que me lo devuelva separado y saber difernciar cuál es el titulo y cual el contenido. Por ejemplo para poner los titulos en negrita y el contenido dejarlo normal.

Sabriais como se podria hacer eso con XPath??
Muchisimas gracias a todos