Foros del Web » Programación para mayores de 30 ;) » Java »

Extraer texto de una pagina a Java

Estas en el tema de Extraer texto de una pagina a Java en el foro de Java en Foros del Web. Buenas gente, quisiera saber si es posible extraer el texto de una página web a un nuevo String en Java. Saludos!...
  #1 (permalink)  
Antiguo 04/01/2013, 23:34
 
Fecha de Ingreso: septiembre-2012
Ubicación: Lima, Perú.
Mensajes: 20
Antigüedad: 11 años, 6 meses
Puntos: 0
Pregunta Extraer texto de una pagina a Java

Buenas gente, quisiera saber si es posible extraer el texto de una página web a un nuevo String en Java.

Saludos!
  #2 (permalink)  
Antiguo 05/01/2013, 08:25
 
Fecha de Ingreso: abril-2012
Ubicación: Canarias
Mensajes: 41
Antigüedad: 12 años
Puntos: 5
Respuesta: Extraer texto de una pagina a Java

Código Java:
Ver original
  1. try {
  2.             StringBuffer codeBuffered = new StringBuffer();
  3.             String code;
  4.            
  5.             URL url = new URL("http://www.google.es");
  6.             InputStream in = url.openStream();
  7.             BufferedReader read = new BufferedReader(new InputStreamReader(in));
  8.            
  9.             String line;
  10.             while((line = read.readLine()) != null)
  11.             {
  12.                 codeBuffered.append(line).append("\n");
  13.             }
  14.            
  15.             code = codeBuffered.toString(); // Este es el código de la página :)
  16.  
  17.  //cerramos los streams
  18.  in.close();
  19.  read.close();
  20.         }
  21.         catch(IOException e)
  22.         {
  23.             e.printStackTrace();
  24.         }

Etiquetas: string
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 22:52.