Foros del Web » Programación para mayores de 30 ;) » Programación General »

Reconocer etiquetas HTML

Estas en el tema de Reconocer etiquetas HTML en el foro de Programación General en Foros del Web. Necesito saber como puedo obtener las palabras resaltadas en un documento HTML, por ejemplo, todas las palabras que están en negrita. Saludos...
  #1 (permalink)  
Antiguo 19/03/2008, 11:11
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Antigüedad: 16 años, 1 mes
Puntos: 0
Exclamación Reconocer etiquetas HTML

Necesito saber como puedo obtener las palabras resaltadas en un documento HTML, por ejemplo, todas las palabras que están en negrita.

Saludos
  #2 (permalink)  
Antiguo 19/03/2008, 12:15
Avatar de Raulmmmm  
Fecha de Ingreso: marzo-2007
Ubicación: En otro lugar que tú
Mensajes: 1.549
Antigüedad: 17 años, 1 mes
Puntos: 36
Re: Reconocer etiquetas HTML

Eso se hace con PHP y expresiones regulares:
http://www.desarrolloweb.com/articulos/2033.php
  #3 (permalink)  
Antiguo 19/03/2008, 12:18
Avatar de ElJavista
Colaborador
 
Fecha de Ingreso: marzo-2007
Ubicación: Lima Perú
Mensajes: 2.231
Antigüedad: 17 años, 2 meses
Puntos: 67
Re: Reconocer etiquetas HTML

No estoy seguro si es que esto es lo que necesitas pero eso se puede hacer mediante el DOM usando JavaScript. De este modo:

<script language="JavaScript">
var bs = document.getElementByTagName("b");

for (ele in bs) {
txt = ele.innerHTML // Esto es criticado por muchos así que la alternativa está abajo.
txt = ele.firstChild.nodevalue;
}

A lo mejor quieres usar esos valores para trabajarlos con php, en ese caso lo más recomendable es usar ajax.

</script>
  #4 (permalink)  
Antiguo 19/03/2008, 19:33
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Antigüedad: 16 años, 1 mes
Puntos: 0
Re: Reconocer etiquetas HTML

Gracias, me han dado una idea para empezar a trabjar...
Me han comentado que Perl también es muy bueno en el tratamiento de textos y muy potente en expresiones regulares....
Necesito sugerencias de buena documentación sobre esto.
  #5 (permalink)  
Antiguo 19/03/2008, 20:18
Avatar de webosiris
Moderador egiptólogo
 
Fecha de Ingreso: febrero-2002
Ubicación: Luxor, Egipto
Mensajes: 10.725
Antigüedad: 22 años, 2 meses
Puntos: 998
Re: Reconocer etiquetas HTML

dime que lenguaje dominas para así muevo este mensaje al foro correspondiente
  #6 (permalink)  
Antiguo 19/03/2008, 21:33
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Antigüedad: 16 años, 1 mes
Puntos: 0
Re: Reconocer etiquetas HTML

Me interesa Perl, gracias.
  #7 (permalink)  
Antiguo 20/03/2008, 05:07
Avatar de aloqui  
Fecha de Ingreso: diciembre-2007
Mensajes: 973
Antigüedad: 16 años, 5 meses
Puntos: 24
Re: Reconocer etiquetas HTML

Para perl puedes utilizar la libreria HTML::TreeBuilder
Necesitarás hacer algo así:

use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file ( $file );
my @nodosB = ( $tree->look_down( "_tag", "b" ) );
my @nodosS = ( $tree->look_down( "_tag", "strong" ) );
__________________
Grupos de Música
Pop Music Stars
  #8 (permalink)  
Antiguo 24/03/2008, 12:58
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Antigüedad: 16 años, 1 mes
Puntos: 0
Re: Reconocer etiquetas HTML

Muchas gracias a todos...
  #9 (permalink)  
Antiguo 24/03/2008, 14:31
Avatar de monoswim
$moderador{'Esteban'}
 
Fecha de Ingreso: febrero-2002
Ubicación: Buenos Aires - Argentina
Mensajes: 8.762
Antigüedad: 22 años, 3 meses
Puntos: 90
Re: Reconocer etiquetas HTML

También se puede hacer con expresioner regulares...Sería algo así...

my @b = $html =~ m/<b>(.*?)<\/b>/g;

Pero sería más engorroso, puedes tener problemas con los saltos de línea y demás, mejor con el módulo HTML::TreeBuilder como te lo mostraron...

__________________
Esteban Quintana
  #10 (permalink)  
Antiguo 26/03/2008, 15:46
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Antigüedad: 16 años, 1 mes
Puntos: 0
Mensaje Re: Reconocer etiquetas HTML

Alguien me puede decir como puedo delimitar las oraciones en un texto, teniendo en cuenta que se me pueden presentar casos como :

Lázara M. López Acea, miembro.......

donde como ven un punto no signifuca el fin de la oracion
Si alguen me puede dar una idea
Gracias
  #11 (permalink)  
Antiguo 27/03/2008, 02:31
Colaborador
 
Fecha de Ingreso: mayo-2006
Ubicación: Valladolid
Mensajes: 524
Antigüedad: 18 años
Puntos: 11
Re: Reconocer etiquetas HTML

Deberías usar el módulo Lingua::ES::Sentence, pero lo malo es que ese módulo no existe (todavía).

Lo más parecido es el módulo Text::Sentence, pero en la documentación indica que fallará con los acrónimos y abreviaturas.

Prueba a usar el módulo Lingua::EN::Sentence, que es más parecido a nuestro idioma y además podrás indicar las abreviaturas que tiene que identificar.
  #12 (permalink)  
Antiguo 29/03/2008, 07:56
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Antigüedad: 16 años, 1 mes
Puntos: 0
Re: Reconocer etiquetas HTML

Muchas gracias de nuevo....
Saludos
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta

SíEste tema le ha gustado a 1 personas




La zona horaria es GMT -6. Ahora son las 04:07.