Foros del Web » Programando para Internet » PHP »

Script que "chjupe" los titulares de una web

Estas en el tema de Script que "chjupe" los titulares de una web en el foro de PHP en Foros del Web. Saludos. Estoy interesado en incluir en mi web los titulares de un par de periódicos locales mediante un script. He probado diversos scripts disponibles en ...
  #1 (permalink)  
Antiguo 13/06/2002, 13:44
 
Fecha de Ingreso: junio-2002
Mensajes: 2
Antigüedad: 21 años, 10 meses
Puntos: 0
Script que "chjupe" los titulares de una web

Saludos.

Estoy interesado en incluir en mi web los titulares de un par de periódicos locales mediante un script.

He probado diversos scripts disponibles en la red. El principal de ellos es HPE, aunque está aún en desarrollo y por lo que veo, éste está parado.

Mi interés es "parsear" los titulares de estas webs que están en formato HTML (y que no disponen por tanto, de versión en RDF/RSS o XML, que sería más fácil). El ideal sería que este script funcionase en PHP y MySQL y que periódicamente actualizase de forma automática el contenido.

¿Hay alguien dispuesto a prestarme ayuda?

Gracias por adelantado.
  #2 (permalink)  
Antiguo 13/06/2002, 14:23
 
Fecha de Ingreso: junio-2002
Mensajes: 1
Antigüedad: 21 años, 10 meses
Puntos: 0
Re: Script que "chjupe" los titulares de una web

mmm... amigo me parece que lo que planteas es complicado de ejecutar; si no hay algo de colaboración de parte de los medios de informacion en generar xml o rdf´s.

si los exisitiere yo hace algun tiempo habia hecho algo que los retrotraia de manera mucho mas simple de lo que lo hace HPE, que por cierto lo hace en base a los feeds de cada diario.

http://www.zend.com/codex.php?id=644&single=1

si por alguna razón eres terco y quieres continuar con tu idea podrias hablar con los responsables de los periodicos para que probasen algo simple como el EmbededRSS. (gran trabajo de sebastián)

http://www.zonageek.com/feeds/embededrss/

espero que te pueda servir de ayuda.
  #3 (permalink)  
Antiguo 13/06/2002, 14:39
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 22 años, 3 meses
Puntos: 129
Re: Script que "chjupe" los titulares de una web

Una solucion:

1)Cargar la pagina en un array con fopen() y/o fread() ...

2) Recorrer el array entregado por alguna de las funciones mencionadas y Aplicar un substr() (previamente habiendo localizado algun elemento de la pagina que nos guie donde puede empezar el encabezado).

Un saludo,
  #4 (permalink)  
Antiguo 14/06/2002, 03:12
 
Fecha de Ingreso: abril-2002
Mensajes: 30
Antigüedad: 22 años
Puntos: 0
Re: Script que "chjupe" los titulares de una web

Bueno, yo sé muy poco de PHP, pero lo siguiendo lo q dice cluster, una manera de seleccionar, los títulos sería evaluando el tamaño de la fuente...

No sé si eso es posible :P pero bueno ahí queda :)

Un saludo
  #5 (permalink)  
Antiguo 15/06/2002, 21:58
Avatar de gomo  
Fecha de Ingreso: mayo-2002
Ubicación: [email protected]
Mensajes: 906
Antigüedad: 21 años, 11 meses
Puntos: 0
Re: Script que "chjupe" los titulares de una web

Claro si usas lo que dice Flopi, pensa que seguramente al ser un sitio grande tienen unas hojas de estilo de primera, con hermosos nombres...
Seguramente en ellas hay una clase que se llame .titulares o algo asi...
Y como son páginas dinámicas, los tags son estáticos... Lo que cambia es el contenido...
por ej lees lo que esta entre
"<p class=titulares>" y el "</p>" que viene a continuacion...
Seguramente tengas que contar tambien cuantos titulares hay, si queres contactame por mail a [email protected] porq hice una funcion que hace esto...
Saludos

<div align="center"><img src="http://cablemodem.fibertel.com.ar/sainztrapaga/images/firma.jpg" width="435" height="70" border="0">
</div>
  #6 (permalink)  
Antiguo 16/06/2002, 03:02
 
Fecha de Ingreso: septiembre-2001
Ubicación: Monterrey
Mensajes: 663
Antigüedad: 22 años, 6 meses
Puntos: 6
Re: Script que "chjupe" los titulares de una web

No se que tanta experiencia tengas con php pero lo que necesitas hacer lo podriamos resumir de la siguiente forma:

1.- leer la pagina remota con fopen o mediante fsockopen
2.- leer el contenid buscando algo que te permita identificar el inicio de la noticia y el final para esto te remociendo el uso de expresiones regulares ya se las basadas en per o POXIS.

Para el punto 1 lamentablemente vas a necesitar leer esta seccion del manual:
http://www.php.net/manual/en/ref.filesystem.php
<a href='ir.asp?http://www.php.net/manual/en/ref.network.php' target='_blank'>http://www.php.net/manual/en/ref.network...</a>

Para la segunda seccion tambien necesitas leer esta parte:
<a href='ir.asp?http://www.php.net/manual/en/ref.regex.php' target='_blank'>http://www.php.net/manual/en/ref.regex.p...</a>
<a href='ir.asp?http://www.php.net/manual/en/ref.pcre.php' target='_blank'>http://www.php.net/manual/en/ref.pcre.ph...</a>

Saludos!.
Mty. NL.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 17:29.