Foros del Web » Programando para Internet » PHP »

Monitorizar web

Estas en el tema de Monitorizar web en el foro de PHP en Foros del Web. Me gustaría realizar una monitorización de una URL para que me pueda decir cuando se realizan modificaciones, sin que tenga que estar visitando la web ...
  #1 (permalink)  
Antiguo 01/09/2020, 00:54
Avatar de senseeye3led  
Fecha de Ingreso: abril-2016
Ubicación: 127.0.0.1
Mensajes: 163
Antigüedad: 8 años
Puntos: 11
Pregunta Monitorizar web

Me gustaría realizar una monitorización de una URL para que me pueda decir cuando se realizan modificaciones, sin que tenga que estar visitando la web constantemente.

Un posible algoritmo:

1) Descargar en un fichero la página o su contenido código fuente. (Ya que esa URL no actualiza cabeceras ETAGS o similares).

2) Calcular su SHA512 y almacenarlo.

3) Repetir el proceso cada X tiempo y comparar los SHA512 obtenidos.

¿Alguna posible optimización?

Quiero realizar el desarrollo sin utilizar servicios / apis de terceros, ya que el día que éstos cambien las condiciones o dejen de funcionar no sería válido.
  #2 (permalink)  
Antiguo 01/09/2020, 07:43
SLD
 
Fecha de Ingreso: diciembre-2013
Mensajes: 121
Antigüedad: 10 años, 4 meses
Puntos: 6
Respuesta: Monitorizar web

Cita:
Iniciado por senseeye3led Ver Mensaje
...1) Descargar en un fichero la página o su contenido código fuente.
Efectivamente ésa es la manera de hacerlo, un póco de REGEX te viene bien para DIVIDIR alguna parte del string, pues hay páginas que imprimen la hora ó fecha "ACTUAL", ello cambiaría el SHA* del string resultante sin que el contenido de ésa URL halla cambiado.

Salu2!
  #3 (permalink)  
Antiguo 01/09/2020, 07:52
Avatar de Panino5001
Me alejo de Omelas
 
Fecha de Ingreso: mayo-2004
Ubicación: -34.637167,-58.462984
Mensajes: 5.148
Antigüedad: 19 años, 11 meses
Puntos: 834
Respuesta: Monitorizar web

Cita:
Iniciado por SLD Ver Mensaje
Efectivamente ésa es la manera de hacerlo, un póco de REGEX te viene bien para DIVIDIR alguna parte del string, pues hay páginas que imprimen la hora ó fecha "ACTUAL", ello cambiaría el SHA* del string resultante sin que el contenido de ésa URL halla cambiado.

Salu2!
También los tokens anti CSRF

DOMDocument puede ser útil también.

Última edición por Panino5001; 01/09/2020 a las 08:00
  #4 (permalink)  
Antiguo 01/09/2020, 09:03
Avatar de senseeye3led  
Fecha de Ingreso: abril-2016
Ubicación: 127.0.0.1
Mensajes: 163
Antigüedad: 8 años
Puntos: 11
Respuesta: Monitorizar web

Cita:
Iniciado por senseeye3led Ver Mensaje
Me gustaría realizar una monitorización de una URL para que me pueda decir cuando se realizan modificaciones, sin que tenga que estar visitando la web constantemente.

Un posible algoritmo:

1) Descargar en un fichero la página o su contenido código fuente. (Ya que esa URL no actualiza cabeceras ETAGS o similares).
Código PHP:
$url 'https://www.dominio.com/';
$homepage file_get_contents($url);
$homepage_mb mb_strlen($homepage); 
2) Calcular su SHA512 y almacenarlo.

3) Repetir el proceso cada X tiempo y comparar los SHA512 obtenidos.

¿Alguna posible optimización?

Quiero realizar el desarrollo sin utilizar servicios / apis de terceros, ya que el día que éstos cambien las condiciones o dejen de funcionar no sería válido.

Etiquetas: Ninguno
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 15:17.