Introduzione

In fase di analisi degli accessi al sito è facile rendersi conto che alcuni dati di traffico siano anomali, principalmente in termini di quantità, tipologia e provenienza.

Come accorgersene?

  • Le sessioni totali sono molto elevate e provenienti da zone improbabili data la natura del sito
  • La frequenza di rimbalzo è molto elevata, superiore all’80%
  • La durata della visita media è molto bassa, in genere pochi secondi

Cosa succede? Gran parte dei dati è inquinata da bad bot che scansionano il nostro sito e da bad referral che generano spam. Non causano veri e propri danni, ma sono particolarmente insidiosi e difficili da bloccare, inoltre gli spam bot agiscono anche tramite commenti sui blog e carrelli falsi negli ecommerce…ma niente paura! Possiamo ridurne l’impatto usando alcuni accorgimenti.

I principali metodi sono 3:

  1. Blocco da file .htaccess
  2. Viste Google Analytics filtrate
  3. Widget filtrati nelle dashboard di Analytics

 

1. Blocco da file .htaccess

Teoricamente è il metodo migliore, perché impedisce fisicamente l’accesso al nostro sito a specifici bot e referral. Vediamo come.

Blocco bot user-agent da file .htaccess

Andiamo a scrivere direttamente il nome degli user-agent da bloccare, prendendoli da liste facilmente reperibili online. Ecco un esempio generico:

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^useragentbot1 [OR]
RewriteCond %{HTTP_USER_AGENT} ^useragentbot2 [OR]
RewriteCond %{HTTP_USER_AGENT} ^useragentbot3
RewriteRule .* - [F]

Blocco bot IP da file .htaccess

È possible identificare lo spam tramite accessi ricorrenti dallo stesso IP con dubbia provenienza geografica, ma anche dai commenti spam di un blog o da carrelli abbandonati ricorrenti con stessi importi di un ecommerce. In questo caso possiamo bloccare direttamente l’IP del bot o l’intera classe di IP del bot, ad esempio:

order allow,deny
Deny from 101.101.10.101
allow from all

Blocco bad referrals da file .htaccess

È importante anche bloccare i bad referral che troviamo direttamente nelle statistiche del nostro sito. Quindi in Google Analytics andiamo su Acquisizione > Tutto il traffico > Referral e vediamo ad esempio una lista del genere:

lista referrals

A parte Facebook e t.co (cioè Twitter), gli altri referral non sono desiderati 🙂

Ecco come fermarli da file .htaccess (ad esempio i primi 3):

RewriteEngine On
RewriteCond %{HTTP_REFERER} 4webmasters\.org [NC,OR]
RewriteCond %{HTTP_REFERER} traffic2money\.com [NC,OR]
RewriteCond %{HTTP_REFERER} floating\-share\-buttons\.com [NC]
RewriteRule .* - [F]

 

Quali sono i limiti di questo metodo?
  • Per sua natura funziona solo su server Apache.
  • È necessario poter accedere al sito sul server tramite ftp.
  • Va aggiornato spesso perché bad bot e bad referral cambiano e ce ne sono sempre di nuovi.

 

2. Viste Google Analytics filtrate

Un metodo per avere dati puliti, che può essere usato in aggiunta al precedente, è quello di filtrare i dati direttamente nella piattaforma di analisi. Così facendo, non si blocca l’accesso al sito di bad bot e referral ma li escludiamo dal conteggio. Possiamo così avere una panoramica realistica degli utenti umani che effettivamente navigano sul sito.

Per questo metodo rimando al valido articolo di Fabio Piccigallo, direttamente sul suo sito e riassumo brevemente i principali aspetti.

  • È opportuno creare una nuova vista filtrata e tenere quella originale come controllo.
  • I principali filtri da implementare sono 3, da personalizzare con espressioni regolari in base ai singoli casi. Di seguito gli screenshot di esempio da analytics:

1) Host
filtro analytics nome host

 

 

 

 

 

 

 

 

2) Referral
filtro google analytics referrals

 

 

 

 

 

 

 

 

3) Campagne Adwords
filtro analytics campagne adwords

 

 

 

 

 

 

 

 

 

3. Widget filtrati nelle dashboard di Analytics

Il metodo consiste nel filtrare i dati direttamente all’interno degli widget nelle dashboard di Analytics. Il vantaggio di questo metodo, oltre la rapidità, è di avere dati ripuliti da subito, anche con riferimento a periodi precedenti. Alcuni widget lasciano come riferimento la variazione rispetto al dato originale.

Chiaramente è necessario impostare dashboard ben definite e significative.

Prendiamo lo widget Visite Totali come esempio ed andiamo a inserire un filtro di tipo Non mostrare al suo interno:

widget visite dashboard google analytics

Attraverso un’espressione regolare come quella mostrata sopra, escludiamo la visualizzazione degli accessi provenienti dai principali bad referral del sito.

Prendiamo una piccola dashboard dimostrativa in stile prima e dopo la cura 🙂 per mostrare che i dati filtrati sono molto più realistici di quelli totali.

Non Filtrati

dati dashboard analytics

 

Filtrati

dati filtrati dashboard analytics

 

Conclusioni

Un sito generalmente riceve una notevole parte di sessioni da parte di software non desiderati, che generano dati poco realistici e quindi poco significativi ai fini di analisi della navigazione di utenti umani.

E’ importante avere consapevolezza di questo aspetto in fase di analisi dei dati e cercare metodi sempre più affinati e di rapida implementazione per avere dati puliti e validi.

L’argomento ovviamente non si esaurisce in queste poche righe. Cari SEO, dateci il vostro parere e il vostro contributo! 😉