Tema: Trafico
Ver Mensaje Individual
  #5 (permalink)  
Antiguo 21/08/2003, 04:36
leonardop
 
Fecha de Ingreso: julio-2003
Mensajes: 165
Antigüedad: 20 años, 9 meses
Puntos: 1
Hola Torus,

Gracias por tus comentarios. Respecto a la aclaración que haces de `tráfico', veo que te refieres a la transmisión total de datos (en bytes) que provoca un sitio web determinado. Esta es la razón principal por la que incluí la categoría de `flujo' en el módulo de estadísticas mencionado. Esta categoría aparece bajo el rótulo `Bytes transmitidos' en el archivo de estadísticas generado.

Ahora bien, veo que hay, por lo menos, dos limitaciones importantes en este tipo de enfoque. Por una parte, este algoritmo sólo se encarga de sumar los bytes generados por un solo documento web determinado, y no suma el tráfico de los archivos "auxiliares" (imágenes, etc.) En este sentido, podría modificarse cortamente el programa para que analizara el contenido de la página web inicial, en busca de etiquetas HTML que hicieran referencia a documentos externos (como <img>) y sumara también el flujo de bytes de esos archivos. Si te interesa, podríamos intentar una implementación sencilla de este modelo.

Por otro lado, hay que pensar que cuando se trata de generar estadísticas para fines económicos como el que mencionas (de los resultados de nuestra aplicación depende si cada cliente debe pagar o no recargos de servicio, por ejemplo) hay que ser en extremo cautelosos. Los cálculos de datos pueden fallar. A veces el servidor web puede generar datos inexactos. Algunas páginas podrían crear cabeceras HTTP que deliberadamente indiquen valores falsos sobre la cantidad de bytes que serán en últimas transimitidos por el servidor. Hay muchas variables involucradas y muchos puntos vulnerables a errores (voluntarios o involuntarios).

Personalmente creo que los recursos informáticos en este tipo de situaciones son sólo elementos útiles hasta cierto punto, que ofrecen información valiosa, pero que no debería confiarse en esta información ciega y completamente. En últimas pienso que debe ser una persona de quien dependan las acciones devidadas de los datos que una aplicación de este tipo genera. Es muy importante mantener las cosas en perspectiva y recaer en el sentido común en tanto se haga necesario.


Ahora bien. Ya que hablamos de exactitud y datos confiables, se me ocurre que hay al menos dos alternativas más para la generación de estadísticas de tráfico.
  • Podría recurrirse al uso de gestores y agentes del protocolo SNMP para consultar valores como el número de bytes que son transimitidos a través de un dispositivo de red. Este tipo de enfoque es usado con mucho éxito por piezas de software como mrtg.

    De hecho, no habría que descartar el uso de una aplicación como el mismo mrtg en lugar de crear nuestro propio agente/gestor de SNMP.
  • Otra alternativa, que requeriría de relativamente poco trabajo, es recurrir a los registros (logs) del servidor web para consultar el tráfico generado para cada página y sitio web dado.


Estoy tentado a escribir un pequeño programa en PHP que analice archivos de registro de servidores web, o incluso empezar a jugar con el protocolo SNMP, pero quisiera que me dijeras si realmente existe la necesidad real para tal tipo de aplicación. Además, aun no sé un par de detalles importantes: ¿sobre qué tipo de máquina (sistema operativo, arquitectura, etc.) trabajas? ¿qué servidor web usas?

Sinceramente encuentro muy interesante todo este asunto, solo deseo contribuir algo... :)

Un cordial saludo