Ver Mensaje Individual
  #1 (permalink)  
Antiguo 21/12/2006, 06:15
Aether
 
Fecha de Ingreso: diciembre-2006
Mensajes: 1
Antigüedad: 17 años, 5 meses
Puntos: 0
Extraer enlaces de una Web

Hola a todos,

Estoy haciendo una práctica en la facultad que consiste en crear un generador de mapas de web sites.

Primero intenté extraer los enlaces usando una expresión regular, pero a la hora de intentar sacarlos en determinadas páginas, el programa se quedaba colgado. Cambié la expresión regular y con la nueva no se quedaba colgado, pero en cambio no me cogía todos los enlaces. Así que desistí de usar expresiones regulares.

Así que he probado usando la clase HTMLEditorKit, pero como mucho sólo puedo obtener las direcciones URL de los enlaces, pero no sé cómo obtener el título de los mismos, que es otra cosa que también me interesa.

Entonces... ¿sabéis alguna forma de cómo podría extraer la dirección y el título de los enlaces cuando los extraigo?


Muchas gracias a todos!


Aether