Il web sta diventando semantico?

google-hummingbird-algorithmIl 26 settembre, nel 15° anniversario della fondazione dell’azienda, nello stesso garage dove fu creata, Google ha annunciato l’ultima evoluzione del proprio algoritmo di ricerca, chiamata Hummingbird (colibrì).

Hummingbird, basandosi sul knowledge graph, un gigantesco database che contiene più di 570 milioni di oggetti, persone, ed entità, e più di 18 miliardi di connessioni tra di loro, permette di “comprendere” la richiesta dell’utente, e di restituire risultati precisi e significativi, e individua le risposte ai quesiti dell’utente invece che presentargli un elenco di link.

Amit Singhal, vicepresidente senior della ricerca in Google, ha dichiarato che l’algoritmo è stato rilasciato all’inizio di settembre e che è già utilizzato in più del 90% delle ricerche.

Nello stesso momento, Google ha annunciato che ha rilasciato la ricerca criptata (crypted search) per tutti gli utenti. La ricerca criptata fa in modo che quando un utente giunge a un sito proveniente da Google, non gli siano più indicate, come succedeva prima, le parole chiave che l’utente ha usato per arrivarci.

Cosa significano queste due novità per il search marketing, e che effetti avranno su tutti noi, sia come utenti di Google che come aziende che vogliono ottimizzare la propria presenza sul web per i motori di ricerca?

L’efficacia dei motori di ricerca si basa sulla capacità di individuare al meglio possibile i siti da mostrare basandosi sulle parole che digitiamo nel box di ricerca.

I motori di ricerca ci riescono analizzando tutte (o quasi) le pagine presenti sul web, ed estraendone delle parole chiave che sono poi confrontate con quelle che noi inseriamo quando cerchiamo qualcosa.

Google ha rivoluzionato il settore, ed è diventato leader mondiale delle ricerche, inventando un algoritmo particolarmente efficace. In seguito lo ha notevolmente migliorato dapprima introducendo il pagerank (una classificazione delle pagine più rilevanti in base al numero di siti che puntano a quel sito, e al numero di utenti che hanno selezionato quella pagina come risultato della ricerca), e poi “Penguin” e “Panda”, nuovi algoritmi che tengono conto di sempre nuovi parametri (ormai più di 200!) per decidere quali sono le pagine più significative da mostrare all’utente.

Questo approccio ha dei limiti. Ad esempio, se in inglese si cerca “cars for sale”, si ottengono risultati diversi dalla ricerca di “automobiles for sale”, sebbene semanticamente non ci sia alcuna differenza.

Per migliorare davvero la ricerca, i diversi motori devono riuscire a capire, per quanto possibile, cosa stiamo chiedendo. Passare da un incrocio tra le parole inserite nella ricerca con quelle presenti nel documento, alla comprensione degli argomenti trattati costituisce una enorme sfida per i motori di ricerca e per l’intera comunità dell’information technology mondiale.

Arrivare ad una vera e propria comprensione dei testi è un obiettivo non ancora raggiungibile con le tecnologie attuali, poiché essa presuppone, ed è una caratteristica fondante, dell’intelligenza. I computer moderni sono potentissimi, ma sono stupidi.

Non potendo ancora ottenere una sorta di intelligenza delle macchine, Google ha pensato di simulare questo risultato sfruttando l’enorme potenza di elaborazione  che ha nei propri datacenter.

Ha così realizzato un enorme database che riunisce fatti ed informazioni su persone, cose, aziende, avvenimenti, e, basandosi sulle attività dei propri utenti, le ha correlate tra di loro. Attualmente in questo gigantesco database ci sono più di 570 milioni di entità e più di 18 miliardi di correlazioni.

Quando un utente cerca qualcosa Google trova tutte le correlazioni, e può capire qual è l’oggetto della ricerca, e trovare una serie di informazioni, di fatti ed eventi correlati. E mostrerà non più un elenco di link, ma informazioni. Provate a digitare “Obama” in Google, e vedrete che sulla destra comparirà un bel riepilogo su Obama.

Crypted search e Hummingbird. Cosa comportano queste due novità per i marketer, i SEO specialist, ed in generale per chi si occupa di comunicazione digitale?

Premesso che Hummingbird non agisce sull’algoritmo vero e proprio di ricerca, come hanno fatto Panda e Penguin nel passato, e che quindi non è necessario modificare le tecniche SEO che si utilizzano, da oggi le pagine web i cui contenuti sono più attinenti ad una certa ricerca saranno mostrate con maggiore evidenza delle altre anche di quelle di siti con rank molto alto.

Il contenuto diventa centrale. Ancora una volta, e sempre di più, content is king.

Per ottenere un buon ranking su Google da oggi non basterà più inserire le giuste parole chiave, e i link migliori. Google analizzerà di cosa si parla e favorirà una pagina con contenuto più recente, o di qualità migliore.

Cosa possiamo fare per avvantaggiarci di questa novità?

  • Le tecniche tradizionali di SEO per le parole chiave sono ancora valide, e Hummingbird non modifica niente. Semplicemente sono diventate meno rilevanti.
  • I siti che utilizzano vere e proprie tecniche di spamming con le parole chiave, e quelli che assemblano contenuti poco interessanti, pensati solo come contenitori per le parole chiave, diventeranno sempre più secondari.
  • Sempre più, l’unico modo per avere ranking rilevanti nelle ricerche è scrivere e pubblicare contenuti realmente interessanti, che approfondiscono gli argomenti e dicono cose interessanti per gli utenti. Se lavorate bene e producete buoni contenuti, le vostre pagine saranno sempre più rilevanti, e potete essere felici di questa novità.
  • In caso contrario, la pacchia sta finendo. C’è sempre meno spazio per le tecniche SEO che portano su nel ranking artificialmente un sito.

Cosa significano in particolare queste novità nel mercato farmaceutico?

Il mercato farmaceutico sta vivendo in questi anni un importante cambiamento di paradigma. Si passa dal vendere i farmaci a curare le malattie. E’ un passaggio epocale, che sposta il focus dal prodotto al paziente.  Questo passaggio sta già autonomamente creando la necessità per le aziende farmaceutiche di fornire, oltre ai farmaci, contenuti e informazioni di qualità sempre migliore.

Il mercato farmaceutico, poi, è storicamente iperregolamentato, e quindi non sono comuni pratiche come il keyword spamming (creare contenuti finti, infarciti di parole chiave, solo per aumentare il proprio ranking).

Per queste ragioni chi comunica in questo segmento di mercato ha tutte le ragioni per accettare queste novità con grande ottimismo.

Ancora di più, chi è più bravo avrà più successo.

Avete notato qualche differenza nei risultati di Google? Ritenete che questa novità possa modificare le vostre strategie di marketing digitale? Come?

Per approfondire:

Knowledge graph e semantic web

Google’s Knowledge Graph: one step closer to the semantic web?

Google’s Knowledge Graph: Yeah, that’s the Semantic Web (sort of)

Keyword-based search e semantic search

A comparison of keyword-based and semantics-based searching 

Gli algoritmi di Google

Google Algorithm Change History

Algorithms rank relevant results higher