Ver Mensaje Individual
  #4 (permalink)  
Antiguo 06/07/2013, 07:28
max_mouse699
 
Fecha de Ingreso: abril-2011
Mensajes: 66
Antigüedad: 13 años, 1 mes
Puntos: 7
Respuesta: Buscar contenido similar para evitar duplicados o reposts

Hola xcars.

Me parece que te molesto un poquito mi respuesta, si eso es cierto, por favor perdoname.

Con respecto a lo que dices, concuerdo contigo, a mi tambien en alguna oportunidad tuve que realizar ese tipo de ejercicios, pero ese tipo de ejercicios es en alguna medida ineficiente, puesto que tendrias que evaluar ese mismo algortimo por cada uno de los temas de la base de datos.

Ahora, puedes ahorrar esa carga de trabajo muy bien como tu imaginas, dandole al tema una propiedad que es que tenga como etiquetas o tag, asi podras clasificar los temas y bscar los temas que tengan o contengan los mismos tags. Asi reduces la carga.

Si te mencione el ejemplo del idioma, era porque no sabia, pero ya me quedo muy claro. Y en cuanto a la interpretacion, lo que queria mencionar con mi post es que ese tipo de criterios depende a una similitud humana que nosotros realizamos, por eso te mencione de que puede ser un buen algoritmo que no busque exactamente igual al texto, pero que si calcule el pocentaje de similitud que tiene un tema con otro.

Me entusiasmo el tema !!!, dejame ver que averiguo.

Saludos.