Ver Mensaje Individual
  #2 (permalink)  
Antiguo 02/02/2008, 23:56
Avatar de HackmanC
HackmanC
 
Fecha de Ingreso: enero-2008
Ubicación: Guatemala
Mensajes: 1.817
Antigüedad: 16 años, 3 meses
Puntos: 260
Re: Extraer URL's de una web con regex

Grupos con () ...
Código:
String regex = "<\\s*?[Aa]\\s+?(.*?)>.*?<\\s*?/[Aa]\\s* ?>";
Extraer el 1 grupo ...
Código:
while (matcher.find()) {
  listaLinks.add(matcher.group(1));
}
Aunque todavía le hace falta tomar en cuenta class, style y otros attributos a ese regex.
y eliminar el href=" "

String regex = "<\\s*?[Aa]\\s+?href=\"\\s+?(.*?)\">.*?<\\s*?/[Aa]\\s* ?>";

Saludos,