Foros del Web » Programación para mayores de 30 ;) » Java »

Problema obtener HTML desde Java

Estas en el tema de Problema obtener HTML desde Java en el foro de Java en Foros del Web. Hola, estoy intentando obtener datos de una página web desde Java. Para ello estoy usando las librerías XPath , de momento he logrado conectarme a ...
  #1 (permalink)  
Antiguo 05/10/2009, 05:58
 
Fecha de Ingreso: diciembre-2008
Mensajes: 100
Antigüedad: 15 años, 4 meses
Puntos: 0
Problema obtener HTML desde Java

Hola,

estoy intentando obtener datos de una página web desde Java. Para ello estoy usando las librerías XPath, de momento he logrado conectarme a la página principal, logearme y entrar pulsando el botón (HtmlSubmitInput). Pero el problema está en que tras logearte como usuario, la página tarda un tiempo en cargar y usando el método click para el HtmlSubmitInput, obtiene la página inmediatamente; es decir, sin que termine de cargar... y eso no es lo que quiero. Me gustaría obtener la página totalmente cargada para poder obtener los datos. Sólo he conseguido que se cargara como máximo un 83%, usando refresh (de la clase HtmlPage). He probado otras alternativas pero eso es lo máximo que he podido llegar...

¿Hay alguien que conozca alguna forma de obtener la página HTML transcurrido un tiempo (cuando termine de cargar) usando XPath o de alguna otra forma?


Espero haberme explicado, gracias. Un saludo
  #2 (permalink)  
Antiguo 05/10/2009, 06:21
Avatar de Fuzzylog  
Fecha de Ingreso: agosto-2008
Ubicación: En internet
Mensajes: 2.511
Antigüedad: 15 años, 8 meses
Puntos: 188
Respuesta: Problema obtener HTML desde Java

Se me ocurren dos posibilidades.

1. Estimar el tiempo normal de carga de la web y crear un timer que se inicie al loguearse y permita realizar solo el evento click una vez haya pasado el tiempo estimado.

2. Utilizar el onRender() de javascript para controlar cuando se han terminado de cargar todos los elementos de la web una vez logueado y limitar el click a que dicho evento devuelva true.
  #3 (permalink)  
Antiguo 05/10/2009, 06:48
 
Fecha de Ingreso: diciembre-2008
Mensajes: 100
Antigüedad: 15 años, 4 meses
Puntos: 0
Respuesta: Problema obtener HTML desde Java

Cita:
Iniciado por Fuzzylog Ver Mensaje
Se me ocurren dos posibilidades.

1. Estimar el tiempo normal de carga de la web y crear un timer que se inicie al loguearse y permita realizar solo el evento click una vez haya pasado el tiempo estimado.

2. Utilizar el onRender() de javascript para controlar cuando se han terminado de cargar todos los elementos de la web una vez logueado y limitar el click a que dicho evento devuelva true.
Gracias por responder.

En cuanto a lo que propones:

1. Lo de estimar el tiempo de carga me parece lógico. El problema está en que tras utilizar el método click (del HtmlSubmitInput) este devuelve la página html (HtmlPage) y justo tras utilizarlo no le ha dado tiempo a cargarse a la página. Por lo que devuelve la página con el texto "cargando... 0%". Lo ideal sería que tras hacer click, no obtuviera la página html, sino que esperara X segs (el tiempo que comentábamos). Pero no encuentro la forma de hacerlo (y menos con XPath).

2. No sé muy bien a qué te refieres, ni que tiene que ver Javascript en esto (la página no es mía y no creo que pueda modificar el código para agregar eventos si es a eso lo que te refieres).
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 15:32.