Foros del Web » Programando para Internet » PHP »

Obtener código fuente (HTML) de una página

Estas en el tema de Obtener código fuente (HTML) de una página en el foro de PHP en Foros del Web. Buenas tardes, estoy intentando crear una plataforma que recopila datos de otra página web, para ello debo obtener el código html de una página y ...
  #1 (permalink)  
Antiguo 02/01/2012, 11:41
 
Fecha de Ingreso: enero-2012
Ubicación: Ontinyent
Mensajes: 16
Antigüedad: 12 años, 3 meses
Puntos: 0
Obtener código fuente (HTML) de una página

Buenas tardes, estoy intentando crear una plataforma que recopila datos de otra página web, para ello debo obtener el código html de una página y una vez lo tengo procesarlo para conseguir la parte del código que me interesa.

Me gustaría saber como puedo obtener en una variable el código HTML de una web.

Muchas gracias.
  #2 (permalink)  
Antiguo 02/01/2012, 11:56
Avatar de Patriarka  
Fecha de Ingreso: enero-2011
Ubicación: Moreno, Buenos Aires, Argentina
Mensajes: 2.851
Antigüedad: 13 años, 3 meses
Puntos: 288
Respuesta: Obtener código fuente (HTML) de una página

busca info sobre esta funcion file_get_contents
  #3 (permalink)  
Antiguo 02/01/2012, 12:04
 
Fecha de Ingreso: enero-2012
Ubicación: Ontinyent
Mensajes: 16
Antigüedad: 12 años, 3 meses
Puntos: 0
Respuesta: Obtener código fuente (HTML) de una página

Cita:
Iniciado por Patriarka Ver Mensaje
busca info sobre esta funcion file_get_contents
Gracias por tu rápida respuesta Patriarka, ya había probado con file_get_contents(), funciona en algunas páginas y en otras no, creo que puede ser por el archivo robots.txt.

Hay alguna forma de hacer que esta función fuerce la obtención del código? O alguna otra forma de obtenerlo?

Muchas gracias y saludos.
  #4 (permalink)  
Antiguo 02/01/2012, 12:07
Avatar de SetheR  
Fecha de Ingreso: enero-2009
Mensajes: 265
Antigüedad: 15 años, 3 meses
Puntos: 44
Respuesta: Obtener código fuente (HTML) de una página

Prueba con cURL
  #5 (permalink)  
Antiguo 02/01/2012, 13:46
Colaborador
 
Fecha de Ingreso: mayo-2008
Ubicación: $MX['VZ']['Xalapa']
Mensajes: 3.005
Antigüedad: 15 años, 11 meses
Puntos: 528
Respuesta: Obtener código fuente (HTML) de una página

si usas file_get_contents con una dirección http, éste accede a una web como si fuera cualquier persona, si no obtienes el html que esperas, es por que quizá dicho html sea generado a posteriori o con javascript. En tal caso, si, deberías probar con curl
  #6 (permalink)  
Antiguo 02/01/2012, 13:59
 
Fecha de Ingreso: enero-2012
Ubicación: Ontinyent
Mensajes: 16
Antigüedad: 12 años, 3 meses
Puntos: 0
Respuesta: Obtener código fuente (HTML) de una página

Muchas gracias SetheR y ocp001a, probaré con cURL y ya os digo algo, feliz año nuevo! :D
  #7 (permalink)  
Antiguo 04/01/2012, 02:36
 
Fecha de Ingreso: enero-2012
Ubicación: Ontinyent
Mensajes: 16
Antigüedad: 12 años, 3 meses
Puntos: 0
Respuesta: Obtener código fuente (HTML) de una página

Muchas gracias a los que respondieron, me ha ido genial con cURL, lo utilizaré más a menudo :)

Etiquetas: fuente, html, página, variables
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 01:21.