Estoy desarrollanod un Crawler con java y necesito extraer todas las imagenes de las paginas web que parseo. El crawler que tengo hecho localiza las URL usando el siguiente pedazo de script:
Código:
Supongo que para buscar imagenes sera modificar la parte del Pattern.compile("...")Pattern p =
Pattern.compile("<a\\s+href\\s*=\\s*\"?(.*?)[\"|>]",
Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(pageContents);
Sabría alguien decirme que linea debo incluir ahi para que me encuentre las imágenes del código HTML que estoy parseando???
Muchas gracias a todos y un saludo


