Foros del Web » Programando para Internet » PHP »

Comparar Similitud HTML entre dos páginas

Estas en el tema de Comparar Similitud HTML entre dos páginas en el foro de PHP en Foros del Web. Hola a todos, estoy buscando la manera de intentar descubrir cuando un usuario me engaña publicando la misma página dos veces en mi sistema. Se ...
  #1 (permalink)  
Antiguo 02/01/2015, 17:09
 
Fecha de Ingreso: abril-2010
Ubicación: Ping: BSAS - Arg
Mensajes: 791
Antigüedad: 9 años, 7 meses
Puntos: 25
Comparar Similitud HTML entre dos páginas

Hola a todos, estoy buscando la manera de intentar descubrir cuando un usuario me engaña publicando la misma página dos veces en mi sistema.

Se me ocurre usar CURL para leer parte de la cabecera o parte del html y cotejarlo, el desafío pasa por implementarlo a nivel %, sé como hacerlo perfectamente en curl, pero no tendría ningún tipo de tolerancia o forma de comparar.

Es decir, que el sistema pueda concluir, entre la url 1 y 2: hay un 30% de similitud (siendo 100% la misma página, por ejemplo).

¿Hay librerias (sin POO) o ideas de como hacerlo?

Gracias y Feliz Año a Todos!!
  #2 (permalink)  
Antiguo 02/01/2015, 21:46
Avatar de loncho_rojas
Colaborador
 
Fecha de Ingreso: octubre-2008
Ubicación: En el mejor lugar del mundo
Mensajes: 2.704
Antigüedad: 11 años, 1 mes
Puntos: 175
Respuesta: Comparar Similitud HTML entre dos páginas

Guat? la verdad que no entiendo porque quieres comparar algo así... en todo caso, si es cuestion de permisos para realizar X acción, deberías limitarlo antes de que se cree algo, no despues.. no te parece?
__________________
Ayudo con lo que puedo en el foro, y solo en el foro.. NO MENSAJES PRIVADOS.. NO EMAILS NI SKYPE u OTROS.

Antes de hacer un TOPICO piensa si puedes hallarlo en Google o en el Buscador del Foro...
  #3 (permalink)  
Antiguo 03/01/2015, 08:57
 
Fecha de Ingreso: abril-2010
Ubicación: Ping: BSAS - Arg
Mensajes: 791
Antigüedad: 9 años, 7 meses
Puntos: 25
Respuesta: Comparar Similitud HTML entre dos páginas

Cita:
Iniciado por loncho_rojas Ver Mensaje
Guat? la verdad que no entiendo porque quieres comparar algo así... en todo caso, si es cuestion de permisos para realizar X acción, deberías limitarlo antes de que se cree algo, no despues.. no te parece?
Brindo un servicio con tiempo trial para webmaster, y muchos webmasters tienen un sitio web con varios dominios, la idea es evitar eso justamente, muchos aún son más "vivos" y modifican ciertas cosas y al final cosas como comparar cabeceras terminan siendo inútiles.
  #4 (permalink)  
Antiguo 03/01/2015, 11:08
 
Fecha de Ingreso: abril-2010
Ubicación: Ping: BSAS - Arg
Mensajes: 791
Antigüedad: 9 años, 7 meses
Puntos: 25
Respuesta: Comparar Similitud HTML entre dos páginas

Solucionado:

Código PHP:

$text 
file_get_contents("http://urluno.com/");
$html file_get_contents("http://urldos.com/");

similar_text($html$text$percentage); // Calculating ...
echo $percentage
  #5 (permalink)  
Antiguo 03/01/2015, 11:59
 
Fecha de Ingreso: diciembre-2012
Ubicación: Murcia
Mensajes: 329
Antigüedad: 7 años
Puntos: 4
Respuesta: Comparar Similitud HTML entre dos páginas

Cita:
Iniciado por dezagus Ver Mensaje
Solucionado:

Código PHP:

$text 
file_get_contents("http://urluno.com/");
$html file_get_contents("http://urldos.com/");

similar_text($html$text$percentage); // Calculating ...
echo $percentage
Puedes utilizar la función round para redondear el resultado. por si te interesa.

Código PHP:
echo round($percentage); 
Saludos.

Última edición por Jose789; 03/01/2015 a las 12:07

Etiquetas: html, páginas
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 21:51.