Cerca nel blog

lunedì 12 marzo 2007

Google: da ballerino a surfista

Analisi del comportamento del motore di ricerca più famoso al mondo, nella fase di aggiornamento dei propri indici su tutti i datacenter.

Dalla frenesia della Google Dance alle onde sinusoidali

La Google Dance, non era altro che il fenomeno mensile nel quale, il motore di ricerca Californiano, aggiornava i propri archivi, ricalcolando il numero dei backlink (link che ogni pagina “riceve” dalle altre pagine) e di conseguenza il PageRank (voto espresso in valore numerico da 0 a 10 utilizzato da Google per attribuire l’importanza di una pagina in funzione del numero di backlink che essa riceve).

Il “ballo”, anche se non sempre costante nella sua manifestazione, durava all’incirca una settimana e condizionava il posizionamento nel mese successivo di tutti i siti. Proprio per questo motivo tutti i webmaster, che ponevano parecchia attenzione al posizionamento nei motori di ricerca, seguivano questo processo con estrema attenzione ed ansie al limite del cardiopalma.

Questo perchè in fase di “Dance” Google restituiva risultati delle ricerche (dette SERP) molto diverse rispetto alle posizioni prima e dopo il fenomeno, anche in funzione dei datacenter interrogati (proprio per questo motivo l’evoluzione è stata denominata GoogleDance, infatti pareva un vero e proprio ballo di tutti i posizionamenti sia in salita sia in discesa negli indici).

Tuttavia, ora il motore di Mountain View ha cambiato metodologia nell’aggiornamento dei propri indici, infatti non avvengono più con cadenze prestabilite ma giornalmente: grazie all’incessante lavoro eseguito dagli spider (programmi – detti anche robots - appositamente creati per ricercare, prelevare ed archiviare ogni dato valido per il calcolo del ranking contenuto all’interno ed all’esterno di ogni pagina web) che evitano la scansione mensile di massa delle pagine (chiamata Deep Crawl) come avveniva appunto nella fase Google Dance.

Ciò nonostante, talvolta, Google attua ancora un fenomeno simile alla GoogleDance, che colpisce la gran parte delle pagine indicizzate, proponendo in questo preciso periodo risultati molto differenti da quelli mostrati in condizioni di normalità. I siti, con le loro pagine, che subiscono questi mutamenti repentini di posizionamenti sono vittima di fluttuazioni sinusoidali volte all’aggiornamento e quindi all’allineamento di tutti i datacenter del famoso motore di ricerca.

Il nuovo processo ha preso il nome dall’onda sinusoidale generata dal grafico dei posizionamenti ottenuti in questa fase in brevi lassi temporali: cioè nello per una medesima query (interrogazione/ricerca) eseguita ad intervalli temporali di breve durata (si parla di qualche ora) la pagina risulta visibile in taluni casi ed invisibile in altri.

Perchè Google effettua queste fluttuazioni alle proprie SERP ?

A questo proposito, mi ricollego ad alcuni spunti citati da Francesco De Francesco (fradefra) in una discussione aperta sul forum GT incentrata allo studio di questo fenomeno.

Infatti i possibili scenari che caratterizzano e motivano l’utilizzo di questo processo di aggiornamento/allineamento dei risultati delle ricerche per Google possono essere così sintetizzati (in ordine sparso):

- Google è un’azienda, pertanto è sempre alla ricerca di nuovi clienti, che non sono sicuramente i SEO che lavorano sul posizionamento organico/naturale ma gli inserzionisti di Google Adwords. Basta quindi modificare e rimescolare le posizioni di SERP competitive ad alta redditività (per esempio il settore turistico di prenotazioni alberghiere) per “imporre” a realtà di business on-line l’utilizzo dei propri servizi di promozione in PPC per non subire perdite insanabili.

- Inserimento di nuovi algoritmi di calcolo del ranking, che hanno necessità di alcuni giorni (a volte mesi) per adattarsi a quelli precedenti ed operare in modo efficiente all’unisono con i precedenti

- Google gestisce decine di miliardi di pagine, e ne deve calcolare in “tempo reale” la posizione negli indici, pare normale che vi siano oscillazioni di questo tipo

- Eliminazione dello SPAM e sistemazione programmata degli indici, Google come ogni altro motore di ricerca è vittima di forti azioni di Spamming e la presenza di questo fra le SERP è sicuramente pericolosa in quanto potrebbe far perdere a Google la sua risorsa principale: gli utenti che effettuano miliardi di ricerche ogni giorno. In questi termini sarebbe ipotizzabile, una sorta di comando che permetta di far emergere tutte le pagine SPAM o con contenuti non appropriati per ogni settore/keyword, eliminarle e poi far tornare il tutto come era prima (operazioni di pulizia e snellimento mirata per ogni SERP)

Quand’è accaduta l’ultima fluttuazione e quali considerazioni sono state fatte?

L’ultima manifestazione delle onde sinusoidali si è manifestata (e forse ancora tuttora in corso per talune keywords) alla fine del mese scorso (febbraio 2007) ed è durata circa 15 giorni.

Per meglio valutare ed analizzare cosa avviene ad un sito vittima di queste vertiginose fluttuazioni, prenderemo in esame un esempio pratico relativo agli andamenti del sito di un mio cliente, che seguo personalmente.

Caso studio

Caratteristiche del sito

  • Settore: Turistico
  • On-line da: 01/03/2006
  • PageRank (Google Toolbar): 4
  • Difficoltà SERP (keywords): Due termini ad elevata competitività
  • Lingua: Inglese
  • Posizione prima della sinusoide: 3° -
  • Pagina posizionata: Home Page

Fonti e specifiche per le rilevazioni

  • Classi di datacenter monitorati:

o New = 64.233.161.107 | 64.233.161.147 | 64.233.171.99 | 64.233.171.104 | 64.233.171.107 | 64.233.171.147

o 64.233.* = 64.233.179.99 | 64.233.179.104 | 64.233.183.99 | 64.233.183.104 | 64.233.185.99 | 64.233.185.104 | 64.233.187.99 | 64.233.187.104 | 64.233.189.104

o 64.* = 64.233.167.99 | 64.233.161.99 | 64.233.161.104 | 64.233.167.104

o 72.* = 72.14.203.99 | 72.14.203.104 | 72.14.203.107 | 72.14.207.99 | 72.14.207.104 | 72.14.207.107

o .99 = 216.239.37.99 | 216.239.39.99 | 216.239.53.99 | 216.239.57.99 | 216.239.59.99 | 66.102.11.99 | 66.102.9.99 | 66.102.7.99.99

o .104 = 216.239.63.104 | 216.239.39.104 | 216.239.37.104 | 216.239.59.104 | 216.239.53.104 | 66.102.11.104 | 66.102.9.104 | 66.102.7.104 | 216.239.57.104

o .107 = 64.233.179.107 | 64.233.183.107 | 66.102.9.107 | 72.14.207.107 | 216.239.37.107 | 216.239.39.107 | 216.239.53.107 | 216.239.57.107 | 216.239.59.107

o .147 = 216.239.57.147 | 216.239.59.147 | 66.102.7.147 | 64.233.167.147

  • Risultati controllati: primi 25 risultati per ogni Datacenter
  • Frequenza: plurigiornaliera
  • Rilevazione della presenza: in termini percentuali (quindi assoluti e paragonabili per ogni classe IP di datacenter)

I dati raccolti

* Conteggio attivo solamente nel caso l’home page era presente fra le prime 25 posizioni

Riportando graficamente questi dati è facile intuire ogni singola onda sinusoidale per classi di datacenter, che rileva un andamento simile ma progressivo e non simultaneo di tutte le classi di datacenter.

Infatti, prolungando le linee in un’ipotetica percentuale negativa è possibile tracciare l’effetto grafico proprio delle fluttuazioni sinusoidali che sono andate sempre più ad appiattirsi fino a stabilizzarsi sulla non presenza dell’homepage nella SERP controllata.

L’andamento generale e totale di questa presenza (sulla stima dei datacenter presi in considerazione) difatti manifesta una frequenza piuttosto costante ma in progressivo appiattimento.

In questi termini non solo la presenza nei datacenter ha una tendenza negativa e costantemente discendente, ma anche il posizionamento della stessa pagina: dapprima in 3° posizione, poi in 4° fino ad arrivare in 8° posizione per poi sparire del tutto.

Tuttavia, il fenomeno sinusoidale ha portato ad emergere un’altra pagina che, almeno all’inizio sembrava attratta da un “effetto calamita” dall’homepage, infatti queste due pagine col passare del tempo hanno continuato ad avvicinarsi sempre più fino a congiungersi in 7° ed 8° posizione (questa operazione è stata ipotizzata anche da Kerouac3001 sul suo forum).

Purtroppo, però la situazione è durata solo alcuni giorni ma ha permesso alla seconda pagina di stabilizzarsi in 18° posizione.

Un’altra considerazione importante potrebbe essere fatta analizzando il numero di pagine indicizzate e il numero delle anchor text (ancore testuali dei backlink) sempre per la stessa parola chiave.

Dati prima della sinusoide: 2.180.000 risultati
15.400 anchor text

Dati durante la sinusoide: 2.050.000 risultati
2.050.000 anchor text

Dati dopo la sinusoide: 1.800.000 risultati
14.700 anchor text

Questi dati fanno riflettere, in quanto è notevole lo sbalzo che subiscono i calcoli delle anchor text nel momento in cui le fluttuazioni sinusoidali sono in atto. Eventuali ipotesi e deduzioni a questo riguardo verranno presentate nel punto successivo.

Inoltre c’è anche da notare il fatto che il sito preso in esame è stato colpito da questo processo sinusoidale solamente per parole chiave inerenti o derivanti da quella presa in esame per la realizzazione di questa analisi.

Invece per altri siti vittime di fluttuazioni similari, dopo circa 15 giorni la situazione è tornata in linea a quella precedente al fenomeno.

Deduzioni e conclusioni

Dall’analisi sopra descritta, a mio avviso, è possibile ipotizzare (soprattutto tenendo presente i dati relativi al conteggio delle anchor text) che:

  1. La possibile causa delle fluttuazioni, è dovuta alla variazione del calcolo delle ancore dei backlink (infatti durante le onde, i numero di risultati delle anchor text risulta esattamente uguale a quello dei risultati delle ricerche, il che è matematicamente impossibile in fase di normalità).

  1. Basandosi sulla prima ipotesi, è plausibile che Google abbia la possibilità di attivare/disattivare questa opzione in qualsiasi momento
  1. La motivazione più probabile che porta a questo fatto, sembrano operazioni di manutenzione e soprattutto nella pulizia delle SERP dallo SPAM (infatti difficilmente le pagine spam hanno una considerevole mole di backlink di qualità) ed è una teoria confermata anche dal ritorno della gran parte delle pagine sparite ai propri posti nelle SERP subito dopo l’evento sinusoidale
  1. Inoltre, Google sembra proprio agire a suo piacimento, colpendo ed analizzando settore per settore, parola chiave per parola chiave. Infatti mentre alcuni siti dello stesso settore sono in fluttuazione, altri di categorie differenti sono statici e presentano SERP regolari
  1. La perdita di posizionamento, invece può essere dovuta alla minor spinta in termini di backlink dovuta alla fuoriuscita di pagine e anchor text (vedi dati inferiori fra prima e dopo la sinusoide) forse per una maggior severità del filtro anti-duplicazione e delle modifiche apportate all’algoritmo di google per delimitare il fenomeno del GoogleBombing)
  1. Per non subire le fluttuazioni, occorre avere un’elevata popolarità in grado di sostenere il sito fra le prime posizioni anche in questa delicata situazione. Ad ogni modo si consiglia di operare una promozione del sito a livello globale, non concentrandosi solo su una precisa keywords o desinenze di parole chiavi

Allora su cosa puntare per un buon posizionamento organico duraturo nel tempo ?

Pensare come Google, cioè sviluppare progetti internet rivolti alla soddisfazione dell’utente in modo esaustivo e nel minor tempo possibile, in questo modo i risultati non tarderanno certo ad arrivare.


A cura di Michele De Capitani

Prima Posizione Srl – Servizi di web marketing e posizionamento sui motori di ricerca
Prima fonte di pubblicazione: Articoli seo e web marketing

Nessun commento:

Posta un commento

Disclaimer

Protected by Copyscape


Il CorrieredelWeb.it è un periodico telematico nato sul finire dell’Anno Duemila su iniziativa di Andrea Pietrarota, sociologo della comunicazione, public reporter e giornalista pubblicista, insignito dell’onorificenza del titolo di Cavaliere al merito della Repubblica Italiana.

Il magazine non ha fini di lucro e i contenuti vengono prodotti al di fuori delle tradizionali Industrie dell'Editoria o dell'Intrattenimento, coinvolgendo ogni settore della Società dell'Informazione, fino a giungere agli stessi utilizzatori di Internet, che così divengono contemporaneamente produttori e fruitori delle informazioni diffuse in Rete.

Da qui l’ambizione ad essere una piena espressione dell'Art. 21 della Costituzione Italiana.

Il CorrieredelWeb.it oggi è un allegato della Testata Registrata AlternativaSostenibile.it iscritta al n. 1088 del Registro della Stampa del Tribunale di Lecce il 15/04/2011 (Direttore Responsabile: Andrea Pietrarota).

Tuttavia, non avendo una periodicità predefinita non è da considerarsi un prodotto editoriale ai sensi della legge n.62 del 07/03/2001.

L’autore non ha alcuna responsabilità per quanto riguarda qualità e correttezza dei contenuti inseriti da terze persone, ma si riserva la facoltà di rimuovere prontamente contenuti protetti da copyright o ritenuti offensivi, lesivi o contrari al buon costume.

Le immagini e foto pubblicate sono in larga parte strettamente collegate agli argomenti e alle istituzioni o imprese di cui si scrive.

Alcune fotografie possono provenire da Internet, e quindi essere state valutate di pubblico dominio.

Eventuali detentori di diritti d'autore non avranno che da segnalarlo via email alla redazione, che provvederà all'immediata rimozione oppure alla citazione della fonte, a seconda di quanto richiesto.

Per contattare la redazione basta scrivere un messaggio nell'apposito modulo di contatto, posizionato in fondo a questa pagina.

Modulo di contatto

Nome

Email *

Messaggio *