Retroceder   Foros del Web > Programación para sitios web > Perl y CGI

Respuesta
 
Herramientas Desplegado
Antiguo 19-mar-2008, 11:11   #1 (permalink)
zenya ha deshabilitado el karma
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Exclamación Reconocer etiquetas HTML

Necesito saber como puedo obtener las palabras resaltadas en un documento HTML, por ejemplo, todas las palabras que están en negrita.

Saludos
zenya está desconectado   Responder Citando
Antiguo 19-mar-2008, 12:15   #2 (permalink)
Raulmmmm tiene algunos puntos positivos de karma
 
Avatar de Raulmmmm
 
Fecha de Ingreso: marzo-2007
Ubicación: En otro lugar que tú
Mensajes: 1.392
Re: Reconocer etiquetas HTML

Eso se hace con PHP y expresiones regulares:
http://www.desarrolloweb.com/articulos/2033.php
Raulmmmm está desconectado   Responder Citando
Antiguo 19-mar-2008, 12:18   #3 (permalink)
ElJavista ha deshabilitado el karma
 
Avatar de ElJavista
 
Fecha de Ingreso: marzo-2007
Ubicación: Lima Perú
Mensajes: 801
Enviar un mensaje por MSN a ElJavista
Re: Reconocer etiquetas HTML

No estoy seguro si es que esto es lo que necesitas pero eso se puede hacer mediante el DOM usando JavaScript. De este modo:

<script language="JavaScript">
var bs = document.getElementByTagName("b");

for (ele in bs) {
txt = ele.innerHTML // Esto es criticado por muchos así que la alternativa está abajo.
txt = ele.firstChild.nodevalue;
}

A lo mejor quieres usar esos valores para trabajarlos con php, en ese caso lo más recomendable es usar ajax.

</script>
ElJavista está desconectado   Responder Citando
Antiguo 19-mar-2008, 19:33   #4 (permalink)
zenya ha deshabilitado el karma
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Re: Reconocer etiquetas HTML

Gracias, me han dado una idea para empezar a trabjar...
Me han comentado que Perl también es muy bueno en el tratamiento de textos y muy potente en expresiones regulares....
Necesito sugerencias de buena documentación sobre esto.
zenya está desconectado   Responder Citando
Antiguo 19-mar-2008, 20:18   #5 (permalink)
Moderador HTML y CSS
webosiris es realmente agradablewebosiris es realmente agradablewebosiris es realmente agradablewebosiris es realmente agradablewebosiris es realmente agradablewebosiris es realmente agradable
 
Avatar de webosiris
 
Fecha de Ingreso: noviembre-2002
Ubicación: /home/montevideo
Mensajes: 6.244
Enviar un mensaje por MSN a webosiris Enviar un mensaje por Skype™ a webosiris
Re: Reconocer etiquetas HTML

dime que lenguaje dominas para así muevo este mensaje al foro correspondiente
webosiris esta en línea ahora   Responder Citando
Antiguo 19-mar-2008, 21:33   #6 (permalink)
zenya ha deshabilitado el karma
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Re: Reconocer etiquetas HTML

Me interesa Perl, gracias.
zenya está desconectado   Responder Citando
Antiguo 20-mar-2008, 05:07   #7 (permalink)
aloqui tiene algunos puntos positivos de karma
 
Avatar de aloqui
 
Fecha de Ingreso: diciembre-2007
Mensajes: 973
Re: Reconocer etiquetas HTML

Para perl puedes utilizar la libreria HTML::TreeBuilder
Necesitarás hacer algo así:

use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file ( $file );
my @nodosB = ( $tree->look_down( "_tag", "b" ) );
my @nodosS = ( $tree->look_down( "_tag", "strong" ) );
__________________
Grupos de Música
Music PopStars
aloqui está desconectado   Responder Citando
Antiguo 24-mar-2008, 12:58   #8 (permalink)
zenya ha deshabilitado el karma
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Re: Reconocer etiquetas HTML

Muchas gracias a todos...
zenya está desconectado   Responder Citando
Antiguo 24-mar-2008, 14:31   #9 (permalink)
$moderador{'Esteban'}
monoswim llegará a ser famoso muy prontomonoswim llegará a ser famoso muy pronto
 
Avatar de monoswim
 
Fecha de Ingreso: noviembre-2002
Ubicación: Buenos Aires - Argentina
Mensajes: 7.658
Enviar un mensaje por MSN a monoswim Enviar un mensaje por Yahoo  a monoswim
Re: Reconocer etiquetas HTML

También se puede hacer con expresioner regulares...Sería algo así...

my @b = $html =~ m/<b>(.*?)<\/b>/g;

Pero sería más engorroso, puedes tener problemas con los saltos de línea y demás, mejor con el módulo HTML::TreeBuilder como te lo mostraron...

monoswim está desconectado   Responder Citando
Antiguo 26-mar-2008, 15:46   #10 (permalink)
zenya ha deshabilitado el karma
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Mensaje Re: Reconocer etiquetas HTML

Alguien me puede decir como puedo delimitar las oraciones en un texto, teniendo en cuenta que se me pueden presentar casos como :

Lázara M. López Acea, miembro.......

donde como ven un punto no signifuca el fin de la oracion
Si alguen me puede dar una idea
Gracias
zenya está desconectado   Responder Citando
Antiguo 27-mar-2008, 02:31   #11 (permalink)
Colaborador
jferrero está en el buen camino
 
Fecha de Ingreso: mayo-2006
Mensajes: 347
Re: Reconocer etiquetas HTML

Deberías usar el módulo Lingua::ES::Sentence, pero lo malo es que ese módulo no existe (todavía).

Lo más parecido es el módulo Text::Sentence, pero en la documentación indica que fallará con los acrónimos y abreviaturas.

Prueba a usar el módulo Lingua::EN::Sentence, que es más parecido a nuestro idioma y además podrás indicar las abreviaturas que tiene que identificar.
jferrero está desconectado   Responder Citando
Antiguo 29-mar-2008, 07:56   #12 (permalink)
zenya ha deshabilitado el karma
 
Fecha de Ingreso: marzo-2008
Mensajes: 7
Re: Reconocer etiquetas HTML

Muchas gracias de nuevo....
Saludos
zenya está desconectado   Responder Citando
Respuesta

Calificación: Calificación de Tema: 1 votos, 5,00 de promedio.


Herramientas
Desplegado

Normas de Publicación
No puedes crear nuevos temas
No puedes responder temas
No puedes subir archivos adjuntos
No puedes editar tus mensajes

BB code is Activado
Caritas están Activado
[IMG] está Activado
Código HTML está Desactivado


La Zona horaria es GMT -6. Ahora son las 18:18.


Message Board Statistics

LinkBacks Enabled by vBSEO 3.1.0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93