Ver Mensaje Individual
  #5 (permalink)  
Antiguo 02/04/2015, 05:00
Kritik
(Desactivado)
 
Fecha de Ingreso: marzo-2012
Mensajes: 366
Antigüedad: 12 años, 1 mes
Puntos: 31
Respuesta: Extracción de información de web que ejecuta script antes de mostrarse

En esa dirección que apuntas pasa exactamente lo mismo. Primero se ejecuta un JavaScript y después se muestra el resultado. Este resultado no está en la página inicial y por lo tanto su código HTML original no contiene la información que busco.

He estado viendo a fondo la librería Jsoup y según he visto en otros foros tampoco sirve para recoger información que salga después de ejecutar ningún JavaScript. Si me equivoco decídmelo.

Hace unos días vi por internet otra librería para scraping que sí ejecutaba javascrits, pero tonto de mí no me apunté la página. Alguno me puede dar ideas?

Por último también he estado viendo que existe la posibilidad de usar navegadores dentro de java. Si no hay más remedio me pondría a ver esta posibilidad. Pero me gustaría poder evitarla por todos los recursos de memoria y otros que estoy seguro que dicha opción requeriría.

Edito:
Según Wikipedia:
HtmlUnit es un navegador web sin interfaz de usuario escrito en Java.

Al no usar interfaz de usuario quizá esto no requiera tantos recursos, y pueda ejecutar los scripts de JavaScript de la web que menciono arriba. Vosotros qué pensáis?

Última edición por Kritik; 02/04/2015 a las 05:05