Ver Mensaje Individual
  #3 (permalink)  
Antiguo 08/12/2014, 05:40
Kritik
(Desactivado)
 
Fecha de Ingreso: marzo-2012
Mensajes: 366
Antigüedad: 12 años, 1 mes
Puntos: 31
Respuesta: lector de codigo html

Cita:
Iniciado por Profesor_Falken Ver Mensaje
Buenas,

Si, como supongo, lo que en realidad quieres es hacer algo más complejo que comporte técnicas de webscraping, te recomiento la librería JSoup. http://jsoup.org/.

Un saludo
No tenía ni idea de lo que era el webscraping, pero solo con ver la definición de Wikipedia tengo que decir que si, ese es el plan.

Sin embargo mi programa accederá en busca de esa información a una base de datos local, y cuando no la encuentre lo que hará será acceder a una única web muy sencilla que me dará la distinta información siempre con una misma estructura HTML y la copiará en dicha base de datos para futuras consultas. Por eso cada vez será menos frecuente la búsqueda en la web, y al final implementar la librería jsoup sería inútil, pues cuando ya tenga una base de datos extensa la grandísima mayoría de búsquedas serán en la propia base de datos, y solo esporádicamente necesitaré acceder a la web. Por eso creo que es mejor no implementar librerías a un programa que cuanto más tiempo en funcionamiento tenga menos necesitará de la web.

Por todo ello creo que la clase URL me viene super genial, ya que es super-sencilla de utilizar y no me incrementará tanto como una librería entera la memoria utilizada (y por supuesto... también valoro el tiempo de aprender el funcionamiento de la librería jsoup)

Sin embargo me he dado una vuelta por la web de jsoup, y oye... aunque para este proyecto no lo vaya a necesitar... veo este tema también muy interesante. Y es bueno saber que en este tema ya hay librerías tan avanzadas como parece que lo está esta.

Última edición por Kritik; 08/12/2014 a las 05:45