Ver Mensaje Individual
  #1 (permalink)  
Antiguo 02/12/2012, 17:06
Avatar de xarmagedonx
xarmagedonx
 
Fecha de Ingreso: marzo-2009
Mensajes: 360
Antigüedad: 15 años, 2 meses
Puntos: 29
Busqueda Algoritmo con tf-idf. PHP y MySQL

Hola!!, estoy haciendo un algoritmo con PHP y MySQL, para ordenar una gran cantidad de documentos, y para eso utilizo el tf-idf.

La fórmula de tf-idf es la siguiente:

Cita:
$unterminobuscado/$totalterminosbuscados * log10($numtotaldocumentos/$numdedocumentosdondeaparecetermino)
$unterminobuscado/$totalterminosbuscados = Se evalúa cuantos aciertos tiene un registro, por ejemplo: busco "animales salvajes de áfrica", entonces un resultado posee animales de áfrica (tiene 3 términos acertados, dividido los 4 términos totales).

$numtotaldocumentos/$numdedocumentosdondeaparecetermino = El primero es el total de documentos, que es bastante simple. El segundo es el número de documentos donde aparece cada termino, tomando el ejemplo anterior "animales salvajes de áfrica", evaluamos cuantos tiene animales, cuantos salvajes, y etc.

Bueno, ahora mi duda.

Cómo logro evaluar, mediante PHP, cada término por separado. Ya que las variables $totalterminosbuscados y $numtotaldocumentos lo tengo, pero me quedan 2 incógnitas en la cuenta.

Si por lo menos puedo resolver 1, quedaría una sola que se puede conseguir mediante una cuenta.

Saludos y espero que puedan ayudarme!!