Ver Mensaje Individual
  #1 (permalink)  
Antiguo 14/06/2016, 10:41
tec01
 
Fecha de Ingreso: noviembre-2014
Mensajes: 17
Antigüedad: 9 años, 6 meses
Puntos: 0
¿Cómo extraer enlaces de una URL?

Buenas tardes, estaba probando este código y no logro hacer que funcione:
Use el ejemplo de:
[URL="http://chuwiki.chuidiang.org/index.php?title=Extraer_enlaces_de_una_URL_con_Jav a"]http://chuwiki.chuidiang.org/index.php?title=Extraer_enlaces_de_una_URL_con_Jav a[/URL]

Código:
public class ExtractLinksFromUrl {

   public static void main(String[] args) throws Exception {
	   
	      String content = extractContent("https://www.taringa.net/post/humor/19461893/Imagenes-divertidas-para-acortar-la-semana.html");
	      showLinks(content);
	
	}

	   
 private static String extractContent(String urlString)throws MalformedURLException, IOException {
      URL url = new URL(urlString);
      URLConnection urlConnection = url.openConnection();
      InputStream is = urlConnection.getInputStream();
      BufferedReader br = new BufferedReader(new InputStreamReader(is));
      String content = "";
      String linea = br.readLine();
      while((linea = br.readLine())!=null){
    	  content+=linea;
          linea = br.readLine();	
         }
      br.close();
      return content;
   }

   private static void showLinks(String content) {
      Pattern pattern = Pattern.compile("(?i)HREF\\s*=\\s*\"(.*?)\"");
      Matcher matcher = pattern.matcher(content);
      while (matcher.find()) {
         System.out.println(matcher.group(1));
      }

   }
Con algunas páginas funciona y con otras no, en este caso no da errores pero tampoco muestra nada.