Foros del Web » Programando para Internet » PHP »

Extraer párrafo que contiene palabra

Estas en el tema de Extraer párrafo que contiene palabra en el foro de PHP en Foros del Web. Hola, estoy renegando con las Expresiones Regulares que me cuestan horrores. resulta que quiero hacer un patron que me permita extraer el párrafo entero que ...
  #1 (permalink)  
Antiguo 23/01/2008, 13:37
 
Fecha de Ingreso: noviembre-2002
Mensajes: 46
Antigüedad: 17 años
Puntos: 0
Extraer párrafo que contiene palabra

Hola, estoy renegando con las Expresiones Regulares que me cuestan horrores.

resulta que quiero hacer un patron que me permita extraer el párrafo entero que contiene determinada palabra (por ej: "albahaca") dentro de una cadena html.

Estuve probando varias formas y no me encuentra nada :(

También quería saber cómo poder extraer por ej. 10 palabras antes y 10 palabras después de la palabra buscada.

Les copio mis intentos fallidos a ver si alguien me puede ayudar. Una aclaración, estoy tratando de encontrar un párrafo delimitado por "<br>" o por "<p></p>" o por "<br>y el fin de la cadena, les aclaro eso para que se entienda lo que quise hacer. Tal vez esté mal pensado esa forma de delimitar.

Un abrazo y gracias!

//Intento 1:
$patron_parrafo = "(^(<br>)(albahaca)(<br>)$) | (^(<p>)(albahaca)(</p>)$) | (^(<br>)(albahaca)(\Z)$)";

//Intento 2 (sólo delimité por <br>):
$patron_parrafo = "((^<br>)([:alnum:]|[:alpha:]|[:blank:])?(albahaca)+([:alnum:]|[:alpha:]|[:blank:])?(<br>)$)";

$texto1 = "Ocimum basilicum), de la familia de las lamiáceas, es una hierba aromática anual de crecimiento bajo (entre 40-60 cm) con hojas de un verde lustroso, ovales u ovadas, dentadas y de textura sedosa. Emite espigas florales terminales, con flores tubulares de color blanco o violáceo.<br>
La albahaca es una planta es muy sensible a las heladas. Se cultiva únicamente por semillas, que se pueden sembrar en semilleros o macetas en un invernadero a principios o mediados de la primavera. Requiere una posición soleada, aunque en climas de veranos muy calurosos agradece algo de sombra y suelos fértiles, permeables y húmedos.<br>";

$texto2 = "<p>La <b>albahaca</b> (<i><b>Ocimum basilicum</b></i>), de la familia de las <a href=\"/wiki/Lamiaceae\" title=\"Lamiaceae\">lamiáceas</a>, es una <a href=\"/wiki/Hierba\" title=\"Hierba\">hierba</a> aromática anual de crecimiento bajo (entre 40-60 cm) con <a href=\"/wiki/Hoja\" title=\"Hoja\">hojas</a> de un verde lustroso, ovales u ovadas, dentadas y de textura sedosa. Emite espigas <a href=\"/wiki/Flor\" title=\"Flor\">florales</a> terminales, con flores tubulares de color blanco o violáceo.</p>

<p>Esta planta es muy sensible a las heladas. Se cultiva únicamente por <a href=\"/wiki/Semilla\" title=\"Semilla\">semillas</a>, que se pueden sembrar en semilleros o macetas en un <a href=\"/wiki/Invernadero\" title=\"Invernadero\">invernadero</a> a principios o mediados de la primavera. Requiere una posición soleada, aunque en climas de veranos muy calurosos agradece algo de sombra y suelos fértiles, permeables y húmedos.</p>
<table id=\"toc\" class=\"toc\" summary=\"Tabla de contenidos\">";

$busca_parrafo1 = eregi($patron_parrafo, $texto1, $matriz3);
$busca_parrafo2 = eregi($patron_parrafo, $texto2, $matriz4);

echo "Parrafo en texto1<br>";
for ($x=1; $x<(count($matriz3)); $x++) {
echo "Encontré: ".$matriz3[$x]."<br>";
}
echo "<br><br>";

echo "Parrafo en texto2<br>";
for ($x=1; $x<(count($matriz4)); $x++) {
echo "Encontré: ".$matriz4[$x]."<br>";
}
echo "<br><br>";
  #2 (permalink)  
Antiguo 23/01/2008, 13:56
 
Fecha de Ingreso: diciembre-2005
Mensajes: 122
Antigüedad: 14 años
Puntos: 0
Re: Extraer párrafo que contiene palabra

este es un caso para utilizar preg_match_all.
no tengo php ahora para probar pero para capturar dentro de etiquetas de parrafos pudiera ser así:

$palabra = "albahaca";
preg_match_all("/<p>.*" . $palabra ".*<\/p>/s", $texto, $matches);
  #3 (permalink)  
Antiguo 23/01/2008, 14:27
 
Fecha de Ingreso: noviembre-2002
Mensajes: 46
Antigüedad: 17 años
Puntos: 0
Re: Extraer párrafo que contiene palabra

Gracias, probé esto que me decís pero me da que no lo encuentra en ninguno de los dos textos, y en el 2º debería encontrarlo.

$palabra = "albahaca";
$uno = preg_match_all("/<p>.*" . $palabra ."*<\/p>/s", $texto1, $matriz1);
$dos = preg_match_all("/<p>.*" . $palabra ."*<\/p>/s", $texto2, $matriz2);

if ($uno) {
echo "Párrafo en texto1<br>";
for ($x=1; $x<(count($matriz1)); $x++) {
echo "Encontré: ".$matriz1[$x]."<br>";
}
}
else echo "No hay en texto1";
echo "<br><br>";

if ($dos) {
echo "Párrafo en texto2<br>";
for ($x=1; $x<(count($matriz2)); $x++) {
echo "Encontré: ".$matriz2[$x]."<br>";
}
}
else echo "No hay en texto2";
echo "<br><br>";


No se que hacer :(

Gracias!
  #4 (permalink)  
Antiguo 23/01/2008, 18:07
 
Fecha de Ingreso: noviembre-2002
Mensajes: 46
Antigüedad: 17 años
Puntos: 0
Re: Extraer párrafo que contiene palabra

Nadie sabe cómo puedo resolverlo?
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 20:14.