Ver Mensaje Individual
  #1 (permalink)  
Antiguo 22/01/2006, 18:24
Avatar de forecast
forecast
 
Fecha de Ingreso: octubre-2004
Mensajes: 259
Antigüedad: 19 años, 6 meses
Puntos: 4
problemas con substr_count

Hola amig@s;

Necesito hacer una aplicación que busque palabras en determinada web.

Lo he hecho (a grosso modo) así:

Código PHP:
//abró una web como si fuera un archivo y guardo todo su contenido, en función de la web $datafile puede contener bastante información.
$dataFile=fopen($web,"r")//$web contiene la web a analizar

if($dataFile )
{
   
$buffer="";
   while (!
feof($dataFile)) 
   {
    
$buffer.=fread($dataFile1024);
   }
   
fclose($dataFile);
}

//vector con las palabras a buscar, estos vectores pueden ser de al menos 30  palabras
$palabra[]="palabra1";
$palabra[]="palabra2":
$palabra[]="palabra3";

foreach(
$palabra as $index)
{
   
$total+=substr_count($buffer,$index);
}    
echo 
$total
El problema que tengo con todo esto es que el resultado no se ajusta muy bien a lo que existe, es decir, hay palabras que existen en la web y que no soy capaz de detectar. No se si la función substr_count es adecuada para lo que hago, o si tiene limitaciones (busco las palabras tanto en mayúsculas y minísculas, se que lo tiene en cuenta).

A ver si alguién me dice como afinar un poco más a la hora de buscar estas palabras.

Gracias de antemano.