Foros del Web » Programación para mayores de 30 ;) » Java »

Obtener los elementos de unan página web

Estas en el tema de Obtener los elementos de unan página web en el foro de Java en Foros del Web. Hola: Necesito guardar información de documentos XML en una base de datos. Los documentos XML los obtengo a partir de páginas web, y pasar los ...
  #1 (permalink)  
Antiguo 22/10/2006, 04:49
Avatar de DyoSa  
Fecha de Ingreso: octubre-2006
Mensajes: 9
Antigüedad: 17 años, 6 meses
Puntos: 0
Obtener los elementos de unan página web

Hola:

Necesito guardar información de documentos XML en una base de datos. Los documentos XML los obtengo a partir de páginas web, y pasar los documentos en HTML, XHTML, ... a XML ya lo se hacer, utilizo una librería que se llama HotSAX. Aunque si sabéis de otra mejor, pues nunca está de más saberlo.

El problema es cómo puedo obtener los diferentes elementos del documento en XML. Os pongo un ejemplo: me interesa obtener las diferentes imágenes y menús con los enlaces de una página web.

Según tengo entendido, los SAX parsers me servirían para eso, ¿no? ¿O tengo que trabajar con otra cosa?

Y, ¿alguien sabe de algún tutorial, paginas web, etc (en español preferiblemente) que me enseñe a usar las librerías que necesite?

Por cierto, trabajo en java.

A ver si me podeis ayudar, que estoy un poco verde en esta rama, y cuantas más páginas web miro, más me lio. Gracias por adelantado
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 18:40.