Foros del Web » Programando para Internet » PHP »

Extraer contenido del post de un blog

Estas en el tema de Extraer contenido del post de un blog en el foro de PHP en Foros del Web. Hola amigos, tengo realizado un script que me extrae el contenido de los posts de algunos blogs desde sus RSS, pero la cuestion que en ...
  #1 (permalink)  
Antiguo 05/04/2010, 18:16
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Exclamación Extraer contenido del post de un blog

Hola amigos, tengo realizado un script que me extrae el contenido de los posts de algunos blogs desde sus RSS, pero la cuestion que en un RSS no aparece el post completo y eso es lo que necesito.
Los blogs no tienen todos la misma esctructura, por lo que usar expresiones regulares se me complica mucho para crear alguna que me funcione en todos los blogs :S.

Alguien tiene alguna alternativa?? O idea de como armar esa expresion regular???

Estaria muy agradecido. Muchas gracias
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #2 (permalink)  
Antiguo 05/04/2010, 18:23
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años
Puntos: 1517
Respuesta: Extraer contenido del post de un blog

¿Por qué deseas armar una expresión regular, si se supone que un RSS esté estructurado con toda la información necesaria y dividida adecuadamente para poder leer sin complicaciones? Mira este aporte para que entiendas como leer un RSS.
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #3 (permalink)  
Antiguo 05/04/2010, 20:35
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Gracias por la informacion , pero como habia ducho no siempre los rss tienen el articulo completo asi que queria sbaer si hay alguna forma de extraer esa informacion directamente de articulo. Se entiende? :P
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #4 (permalink)  
Antiguo 05/04/2010, 20:54
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años
Puntos: 1517
Respuesta: Extraer contenido del post de un blog

Bueno el articulo lo puedes extraer verificando la dirección completa del articulo y usas cURL o algún socket para tomar la información. Luego con el mismo DOM o con Expresiones Regulares puedes tomar la información.
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #5 (permalink)  
Antiguo 06/04/2010, 13:27
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Muchas gracias, algun manual q me quisieras recomendar??? :P
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #6 (permalink)  
Antiguo 06/04/2010, 13:44
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años
Puntos: 1517
Respuesta: Extraer contenido del post de un blog

En el aporte que te indique puedes verlo
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #7 (permalink)  
Antiguo 06/04/2010, 17:28
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Esta muy completo . Y es el metodo que usaba, pero una duda. ¿Si no se pone todo el articulo de un blog en el rss, es decir, se pone solo el comienzo, cuando lo extraiga lo voy a tener incompleto?Por que ese es el problema que creo q tengo :S
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #8 (permalink)  
Antiguo 06/04/2010, 19:14
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años
Puntos: 1517
Respuesta: Extraer contenido del post de un blog

Pero debe tener la información del enlace hacia la noticia, como quiera puedes obtener la información usando cURL o algún socket.
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #9 (permalink)  
Antiguo 07/04/2010, 15:50
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Claro, pero no creo que pueda usar un patron (que creo que es lo que se usa), para extraer la informacion de los distintos blogs. Por que algunos usan Blogguer, Wordpress y no siguen una estructura especifica. Entonces es imposible o se puede haer, porque eso no lo entiendo si es que se puede hacer :S
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #10 (permalink)  
Antiguo 07/04/2010, 15:59
Avatar de maturano  
Fecha de Ingreso: enero-2010
Ubicación: /home/
Mensajes: 537
Antigüedad: 14 años, 3 meses
Puntos: 36
Respuesta: Extraer contenido del post de un blog

Cita:
Iniciado por tonchii Ver Mensaje
Claro, pero no creo que pueda usar un patron (que creo que es lo que se usa), para extraer la informacion de los distintos blogs. Por que algunos usan Blogguer, Wordpress y no siguen una estructura especifica. Entonces es imposible o se puede haer, porque eso no lo entiendo si es que se puede hacer :S
¿¿¿???

Les un RSS, dentro del mismo RSS tiene una URL al artículo completo (así es como los lectores te dan un enlace para ir a "la noticia original"), tomas esa URL y consultas su contenido; simple. Ya te dejaron un enlace de cómo hacer eso último.

En principio, cuidado con la legalidad de hacer eso ....
__________________
I ♥ The Music!
  #11 (permalink)  
Antiguo 07/04/2010, 16:09
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Cita:
Iniciado por maturano Ver Mensaje
¿¿¿???

Les un RSS, dentro del mismo RSS tiene una URL al artículo completo (así es como los lectores te dan un enlace para ir a "la noticia original"), tomas esa URL y consultas su contenido; simple. Ya te dejaron un enlace de cómo hacer eso último.

En principio, cuidado con la legalidad de hacer eso ....
Por supuesto, pero eso me daria todo el contenido de la pagina, desde el sidebar hasta el foter, y yo solo quiero el texot del articulo :S Ese es el problema que me surge. Porque no puedo crear una sentencia que haga lo mismo con todos los blogs si tienen estructuras diferentes. Se entiende?
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #12 (permalink)  
Antiguo 07/04/2010, 17:05
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Respuesta: Extraer contenido del post de un blog

Pues eso es lo que tienes que programar, no hay una función "magica" que haga todo ese proceso, debes de programar por cada url como esta la estructura de la pagina y que es lo que quieres extraer.
  #13 (permalink)  
Antiguo 07/04/2010, 17:07
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Si ya se que no existe una funcion magica :P jejej. Pero ese es el tema, los blogs son cientos :S. creo que me tendre que conformar con el extracto que hay en el RSS. Pero he visto sitios como teliad que lo pueden hacer :S
__________________
Por que solo seremos dueños de aquello que creemos y amemos
  #14 (permalink)  
Antiguo 07/04/2010, 17:08
Avatar de GatorV
$this->role('moderador');
 
Fecha de Ingreso: mayo-2006
Ubicación: /home/ams/
Mensajes: 38.567
Antigüedad: 18 años
Puntos: 2135
Respuesta: Extraer contenido del post de un blog

Por eso mismo, si lo quieres duplicar tienes que adaptar tu pagina a que pueda leer todos los blogs, es parte de tu tarea de programador el hacer eso.
  #15 (permalink)  
Antiguo 07/04/2010, 17:12
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años
Puntos: 1517
Respuesta: Extraer contenido del post de un blog

Toda web tiene una estructura básica.
Código HTML:
Ver original 
En tu caso podrias tomar la información que haya en el body. También puedes comparar la información que está en el RSS con la información que hayas tomado de la página y crear algún código que continúe hasta el final de la noticia o hasta el final de la página. Solo es cuestión de imaginación.
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #16 (permalink)  
Antiguo 07/04/2010, 17:40
Avatar de tonchii  
Fecha de Ingreso: noviembre-2008
Mensajes: 159
Antigüedad: 15 años, 5 meses
Puntos: 2
Respuesta: Extraer contenido del post de un blog

Cita:
Iniciado por abimaelrc Ver Mensaje
Toda web tiene una estructura básica.
Código HTML:
Ver original 
En tu caso podrias tomar la información que haya en el body. También puedes comparar la información que está en el RSS con la información que hayas tomado de la página y crear algún código que continúe hasta el final de la noticia o hasta el final de la página. Solo es cuestión de imaginación.
Genial, habia pensado en algo parecido erpo valia la pena preguntar XD. Muchas gracias. Me voy a poner a crear el codigo
__________________
Por que solo seremos dueños de aquello que creemos y amemos

Etiquetas: expresiones, extrae, post, regulares, rss
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 18:56.