Ver Mensaje Individual
  #18 (permalink)  
Antiguo 16/08/2007, 00:02
Avatar de sumolari
sumolari
 
Fecha de Ingreso: mayo-2006
Ubicación: localhost
Mensajes: 1.367
Antigüedad: 17 años, 11 meses
Puntos: 18
Re: leer un archivo y buscar contenido entre etiquetas HTML

Bien, quiero extraer datos del insee, la página onde están los datos es:
http://www.recensement.insee.fr/RP99...od=ALL&lang=FR
Si nos fijamos en la URL veremos la variables codgeo. Es variable es la que especifica que datos mostrar. La estructura de la página no varía. Aquí viene lo que quiero hacer:
Código HTML:
<table BORDER="1" RULES="ALL" CELLPADDING="2" BGCOLOR="#FFFFFF" BORDERCOLOR="#FFFFFF" CELLSPACING="0" WIDTH="100%"  >
  <tr BGCOLOR="#336699">
    <td colspan="6"><FONT SIZE="3" COLOR="#FFFFFF"><B>Evolution de la population</B></FONT></td>
 </tr>
  <tr BGCOLOR="#336699" align="center">
    <td  width="25%"><FONT SIZE="2" COLOR="#FFFFFF">&nbsp; </FONT></td>
    <td  width="15%"><FONT SIZE="2" COLOR="#FFFFFF">1968 </FONT></td>
    <td  width="15%"><FONT SIZE="2" COLOR="#FFFFFF">1975 </FONT></td>
    <td  width="15%"><FONT SIZE="2" COLOR="#FFFFFF">1982 </FONT></td>
    <td  width="15%"><FONT SIZE="2" COLOR="#FFFFFF">1990 </FONT></td>
    <td  width="15%"><FONT SIZE="2" COLOR="#FFFFFF">1999 </FONT></td>
  </tr>
  <tr ALIGN="RIGHT">
    <td ALIGN="LEFT"><FONT SIZE="2"> Population sans doubles comptes </FONT></td>
    <td > <FONT SIZE="2"> 510 </FONT></td>
    <td > <FONT SIZE="2"> 444 </FONT></td>
    <td > <FONT SIZE="2"> 470 </FONT></td>
    <td > <FONT SIZE="2"> 482 </FONT></td>
    <td > <FONT SIZE="2"> 447 </FONT></td>
 </tr>
   
</table> 
Esa tabla es siempre igual. Yo quiero coger los datos de las celdas de la 2ª y 3ª fila, es decir: 1968, 1975, 1982, 1990, 1999, 510, 444, 470, 482, 447.
Y que los almacene en variables, por ejemplo, en este caso son años y población de diferentes censos, así que usaría las variables $a1, $a2, $a3, $a4, $a5, $a6, $c1, $c2, $c3, $c4, $c5, $c6.

Tampoco me importa si coge todo el texto que hay en todas las celdas de la página, pues me bastaría con no poner esa variable en la plantilla.

Cuando supiese cómo sacar valores de una tabla de un archivo ajeno ya podría comenzar a hacer más cosas, ya que su fuente n o es sólo insee, hay más páginas, pero con una base ya puedo empezar.

Muchas gracias GatorV