Foros del Web » Programando para Internet » PHP »

Algoritmo con tf-idf. PHP y MySQL

Estas en el tema de Algoritmo con tf-idf. PHP y MySQL en el foro de PHP en Foros del Web. Hola!!, estoy haciendo un algoritmo con PHP y MySQL, para ordenar una gran cantidad de documentos, y para eso utilizo el tf-idf. La fórmula de ...
  #1 (permalink)  
Antiguo 02/12/2012, 17:06
Avatar de xarmagedonx  
Fecha de Ingreso: marzo-2009
Mensajes: 360
Antigüedad: 15 años, 1 mes
Puntos: 29
Busqueda Algoritmo con tf-idf. PHP y MySQL

Hola!!, estoy haciendo un algoritmo con PHP y MySQL, para ordenar una gran cantidad de documentos, y para eso utilizo el tf-idf.

La fórmula de tf-idf es la siguiente:

Cita:
$unterminobuscado/$totalterminosbuscados * log10($numtotaldocumentos/$numdedocumentosdondeaparecetermino)
$unterminobuscado/$totalterminosbuscados = Se evalúa cuantos aciertos tiene un registro, por ejemplo: busco "animales salvajes de áfrica", entonces un resultado posee animales de áfrica (tiene 3 términos acertados, dividido los 4 términos totales).

$numtotaldocumentos/$numdedocumentosdondeaparecetermino = El primero es el total de documentos, que es bastante simple. El segundo es el número de documentos donde aparece cada termino, tomando el ejemplo anterior "animales salvajes de áfrica", evaluamos cuantos tiene animales, cuantos salvajes, y etc.

Bueno, ahora mi duda.

Cómo logro evaluar, mediante PHP, cada término por separado. Ya que las variables $totalterminosbuscados y $numtotaldocumentos lo tengo, pero me quedan 2 incógnitas en la cuenta.

Si por lo menos puedo resolver 1, quedaría una sola que se puede conseguir mediante una cuenta.

Saludos y espero que puedan ayudarme!!
  #2 (permalink)  
Antiguo 03/12/2012, 07:37
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 14 años, 11 meses
Puntos: 1517
Respuesta: Algoritmo con tf-idf. PHP y MySQL

Hmmm según entendí tu pregunta podrías colocar las palabras en un array y recorrerlos con un foreach o el bucle de tu preferencia.
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #3 (permalink)  
Antiguo 03/12/2012, 10:10
Avatar de xarmagedonx  
Fecha de Ingreso: marzo-2009
Mensajes: 360
Antigüedad: 15 años, 1 mes
Puntos: 29
Respuesta: Algoritmo con tf-idf. PHP y MySQL

Exacto, pero como puedo ver cuantos resultados contienen cada término?. Por ejemplo: si busco "delfines rosados", debería separar las palabras en delfines y en rosados.

Luego evaluar por cada resultado si contienen la palabra delfines y la palabra rosados, algunos tendrán una palabra, otros las dos.

Pero como puedo evaluar cada resultado?

Saludos! y gracias

Etiquetas: mysql, tf-idf, algoritmos
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 07:27.