Foros del Web » Programación para mayores de 30 ;) » Java »

Extraer enlaces de una Web

Estas en el tema de Extraer enlaces de una Web en el foro de Java en Foros del Web. Hola a todos, Estoy haciendo una práctica en la facultad que consiste en crear un generador de mapas de web sites. Primero intenté extraer los ...
  #1 (permalink)  
Antiguo 21/12/2006, 06:15
 
Fecha de Ingreso: diciembre-2006
Mensajes: 1
Antigüedad: 17 años, 4 meses
Puntos: 0
Extraer enlaces de una Web

Hola a todos,

Estoy haciendo una práctica en la facultad que consiste en crear un generador de mapas de web sites.

Primero intenté extraer los enlaces usando una expresión regular, pero a la hora de intentar sacarlos en determinadas páginas, el programa se quedaba colgado. Cambié la expresión regular y con la nueva no se quedaba colgado, pero en cambio no me cogía todos los enlaces. Así que desistí de usar expresiones regulares.

Así que he probado usando la clase HTMLEditorKit, pero como mucho sólo puedo obtener las direcciones URL de los enlaces, pero no sé cómo obtener el título de los mismos, que es otra cosa que también me interesa.

Entonces... ¿sabéis alguna forma de cómo podría extraer la dirección y el título de los enlaces cuando los extraigo?


Muchas gracias a todos!


Aether
  #2 (permalink)  
Antiguo 22/12/2006, 02:22
Avatar de Valkam  
Fecha de Ingreso: junio-2006
Ubicación: Sevilla
Mensajes: 157
Antigüedad: 17 años, 10 meses
Puntos: 0
Re: Extraer enlaces de una Web

No puedo darte una solución por que sinceramente no lo se, pero si me lo permites un consejo: creo que deberías insistir con las expresiones regulares

De todas formas...¿como accedes al fuente html?
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 11:56.