Ver Mensaje Individual
  #7 (permalink)  
Antiguo 06/07/2013, 15:50
Avatar de xcars
xcars
 
Fecha de Ingreso: mayo-2005
Ubicación: El Salvador
Mensajes: 753
Antigüedad: 19 años
Puntos: 4
Respuesta: Buscar contenido similar para evitar duplicados o reposts

Saludos. Primero las disculpas del caso, entre por el foro de PHP y habia una subseccion que decia MySQL asi que asumi que era un foro donde se hablaba de temas relacionados, ya que como entenderas este no es un tema de solo PHP o solo MySQL, son ambos trabajando en conjunto y x eso hasta me parecio genial que hubieran abierto la seccion qeu pena que no era asi, y que solo era un enlace dentro del foro de pHP hacia mySQL.

Pero bueno, principalmente no me quiero complicar pues buscare duplicados unicamente para el mismo usuario, es decir, que si el usuario1 pone un anuncio y el usuario2 pone el mismo anuncio, no sera bloqueado, unicamente se evaluara de manera manual para determinar que se hara, por eso es que me centro en como determinar que un anuncio es "similar" a otro, pues al poder determinarlo puedo tomar que otras decisiones o soluciones implementar. Pero en fin como tu dices no es un tema simple, pero ya estoy haciendo un esquema para resolverlo si lo logro resolver lo comparto para ver como se mejora... gracias a ambos por la ayuda....

Cita:
Iniciado por gnzsoloyo Ver Mensaje
Este no es un foro de PHP/MySQL. Es un foro de MySQL, y MySQL no es PHP ni parte de PHP.
En los foros de BBDD analizamos el tema desde la óptica de las bases de datos y el SQL, no de lógica de programación.

Si quieres ver un algoritmo de PHP para resolver el tema, te paso el post al Foro correspondiente, donde están los expertos en PHP y podrás recibir mejor ayuda. De lo contrario, podemos intentar analizar las implicancias en BBDD.

Lo que sí puedo decirte es que un algoritmo, o conjunto de algoritmos como el que necesitas, no se trata de algo menor, si quieres que sea efectivo y eficiente. El problema de la similitud de loa avisos clasificados, es algo recurrente y que ninguna empresa dedicada a esos rubros ha logrado resolver.
Por lo pronto, debes definir mejor el marco de análisis, porque los avisos pueden ser similares, pero los usuarios diferentes, y eso no sería un caso de impedimento, como te puedes imaginar.
También debes considerar los periodos de vigencia de las ofertas, las áreas geográficas implicadas, los subrubros impactados... en definitiva, lo que quiero que decir es que sólo el planteo global del problema requiere de un análisis preliminar mas extenso hablar solamente de similitudes de avisos o publicaciones.
No estoy seguro que esto se pueda resolver sin un equipo de trabajo...
__________________
Con Microaplicaciones puedes hacer tu tienda en línea de forma sencilla y rápida, sin costos ocultos y con mucha responsabilidad.