Foros del Web » Programación para mayores de 30 ;) » Java »

lectura de un fichero html

Estas en el tema de lectura de un fichero html en el foro de Java en Foros del Web. Hola, Estoy leyendo un fichero html a partir de codigo java. El problema que tengo es que cuando recojo un tag (p.e. <A href="#">click</A>) los ...
  #1 (permalink)  
Antiguo 01/09/2003, 09:44
 
Fecha de Ingreso: julio-2003
Mensajes: 58
Antigüedad: 20 años, 10 meses
Puntos: 0
lectura de un fichero html

Hola,

Estoy leyendo un fichero html a partir de codigo java. El problema que tengo es que cuando recojo un tag (p.e. <A href="#">click</A>) los únicos valores que puedo recoger son los atributos del tag A, en este caso el valor de HREF que es #, pero a mi me interesa recoger también el valor del texto del link (CLICK). Alguíen sabe como puedo hacerlo.

Aqui teneis el codigo que utilizo para poder acceder a los tags de html:

import javax.swing.text.*;
import javax.swing.text.html.*;
import javax.swing.text.html.parser.*;

public class DocumentHTML
{
public static String readTag(String nameTag, Document doc)
{

SimpleAttributeSet s = null;

// Iterate through the elements
// of the HTML document.
ElementIterator it = new ElementIterator(doc);
javax.swing.text.Element elem;
while ((elem = it.next()) != null) {
s = (SimpleAttributeSet) elem.getAttributes().getAttribute(HTML.UnknownTag. A);
if (s != null) {
//System.out.println("S a palo seco: " + elem.getContent());
//System.out.println(s.getAttribute(HTML.Attribute.H REF));
System.out.println(((SimpleAttributeSet)elem.getAt tributes().getAttribute(HTML.Tag.A)).toString());
}
}

return null;

}
}

Este codigo me recoge los tags correctamente pero no los valores de texto de dentro de los tags.

Gracias.

Marc.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 19:13.