Web Analytics: Quando Le Statistiche Di Accesso Danno… I Numeri

I diversi programmi di web analytics che misurano gli accessi ad un sito internet molte volte mostrano risultati molto differenti l’uno dall’altro, lasciando disorientato il proprietario del sito. Mi è capitato spesso di imbattermi  in sfoghi di utenti esasperati che non sanno come interpretare questa disocordanza di dati nelle statistiche di accesso ai loro blog.

La situazione che capita più spesso (e magari sarà capitato anche a te) è quella di riscontrare in applicazioni di statistiche esterne come Google Analytics oppure Lloogg numeri in difetto, anche di molto, rispetto alle statistiche di accessi integrate nel proprio server.

Photo Credit: AnaBGD

I falsi visitatori

La ragione è molto semplice: i programmi di web analytics che monitorano gli accessi leggendo i files log del web server (come awstats ad esempio) valutano erroneamente come visite molti contatti che in realtà non lo sono. Ecco una lista dei più comuni falsi positivi che possono sballare le statistiche di una applicazione di tipo log analytics:

XML engines

Quando inserisci il tuo feed in aggregatori XML si attiva un bot che di tanto in tanto controlla il tuo feed per verificare la presenza di eventuali nuovi contenuti. Technorati ad esempio funzionain questo modo: più aggiorni il tuo sito, più passa frequentemente generando un log di accesso che potrebbe essere confuso con un visitatore, invece non lo è.

Spiders

Stesso discorso per i bot dei motori di ricerca che indicizzano le pagine web, i quali a volte sovraccaricano i server a tal punto da mandarli in crash.

Trackback spammers

Questa è una delle cause più comuni di falsi positivi. Se il tuo blog gestisce i trackback ,è soggetto a spam. Bot automatici infatti chiamano continuamente lo script di trackback tentando di inserire dei links. Alcuni di questi bot sono in grado persino di modificare il proprio IP di provenzienza ogni volta che chiamano lo script di trackback, e potrebbero quindi venir visti come visitatori diversi per ogni chiamata.

Spam sui commenti

Stesso discorso per i commenti; applicazioni automatiche tentano continuamente di inserire falsi commenti contenenti links. A prescindere dal fatto che questi vengano o meno bloccati entrano nel log, e possono venir confusi per visitatori.

Queste sono le statistiche di un sito che ha circa 150 visite reali al giorno ma ne vengono riportate molte di più: sono tutti tentativi di spam (bloccati) considerati come visite reali.

Come avere statistiche di accesso affidabili

In poche parole, non è possibile. Almeno utilizzando un solo programma di web analytics. Un consiglio è quello di utilizzare contemporaneamente al proprio programma log analytics una seconda applicazione esterna che utilizza un javascript da inserire nelle pagine che vogliamo monitorare (consiglio LLOOGG).

In questo modo i tentativi di spam sui trackback o sui commenti non verranno neanche presi in considerazione in quanto la visita verrà rilevata solo quando verrà eseguito il javascript sulla pagina di contenuto. In ogni caso non avrai mai delle statistiche assolutamente precise, ma potrai avere una idea più affidabile sul reale traffico del tuo blog.