Ver Mensaje Individual
  #5 (permalink)  
Antiguo 25/04/2011, 10:29
almensilla
 
Fecha de Ingreso: diciembre-2010
Mensajes: 16
Antigüedad: 13 años, 4 meses
Puntos: 0
Respuesta: Obtener y analizar codigo fuente de una web en PHP

Ya se como obtener los h2

Código:
$html = file_get_contents('cualkierweb');
      $dom = new DOMDocument(); // creamos un nuevo documento
      @$dom->loadHTML($html); // cargamos el código html
      // obtenemos todo de la pagina
      $xpath = new DOMXPath($dom);
      $hrefs = $xpath->evaluate("//h2");
      for ($i = 0; $i <$hrefs->length; $i++) {
             $href = $hrefs->item($i);
             $res=$href->textContent;
             echo '<b>'.$res.'</b><br>';
      }
Hasta ahí perfecto, lo que pasa esque quiero complicar la cosa, y aqui me veo con muchas lagunas.

Imaginemos que tenemos una lista:

Código:
<ul>
   <h2>Titulo1</h2>
   <li>Algo1</li>
   <li>Algo2</li>
   <h2>Titulo2</h2>
   <li>Algo3</li>
   <li>Algo4</li>
</ul>
Como puedo hacer para obtener:

Titulo1
Algo1
Algo2

Titulo2
Algo3
Algo4

Si en el XPath escribo //ul lo q me devuleve es un string con todo el contenido junto, pero quiero que me lo devuelva separado y saber difernciar cuál es el titulo y cual el contenido. Por ejemplo para poner los titulos en negrita y el contenido dejarlo normal.

Sabriais como se podria hacer eso con XPath??
Muchisimas gracias a todos