L’informazione generata dagli utenti è Liquida

La blogosfera produce una quantità enorme di contenuti:
centinaia di milioni di articoli, fotografie e video sono continuamente
caricati da milioni di persone in tutto il mondo. Solo in Italia sono emersi su
Internet circa due milioni di blog, 
circa un quarto di questi sono attivi.

Ogni anno i blogger Italiani caricano sul web circa 30
milioni di testi, immagini e video. 
Liquida stima che circa il 3% di questi sono di qualità: ben un milione
l’anno.

Un mare di informazione di qualità che però per essere
realmente fruibile dai consumatori e monetizzabile con la pubblicità e l’ecommerce, deve essere prima identificata,
organizzata e resa disponibile in modo strutturato.

Questo è la missione di RGB, azienda del gruppo Banzai, di
cui mi pregio di essere stato tra i fondatori. E questo è lo scopo di Liquida: applicazione
ideata e realizzata da un team di eccellenza: Andrea Santagata, Fabio Cabula e Paolo
Ruscitti
.

Ho conversato con Andrea Santagata, per fornirci qualche
anticipazione sugli sviluppi futuri di Liquida: 

“in questi mesi ci siamo accorti come il valore dei
contenuti dei post pubblicati dai blogger, non fosse solo nella qualità e
infinita varietà dei temi trattati in ogni singolo post. Analizzando questa multiforme massa di dati, ci siamo resi conto di come si potessero estrarre importanti
informazioni considerando non il singolo post ma l’insieme del contenuto
prodotto. 

Mi spiego meglio, le nostre tecnologie semantiche statistiche, ci
consentiranno a breve di decodificare la blogosfera come se avessimo in mano un grande termometro
della società italiana sempre accesso, 24 ore su 24.

Potremmo non solo capire i temi più discussi (i così
detti hot tags), ma anche il loro trend nel tempo, e analizzare il sentiment
intorno a questi tag, quindi se c’è un sentito positivo o negativo intorno
all’argomento. Potremo anche capire non solo di cosa “scrivono” i
blogger, ma anche cosa linkano, notizie, ma anche libri, persone o siti.

Potremmo capire poi quali temi incontrano interesse in un
pubblico, confrontando i tag con le parole più cercate o i post più visitati.

Tutto questo lo vogliamo rendere disponibile a breve in una apposita sezione di Liquida.

Inoltre per rendere Liquida e i contenuti in essa
valorizzati, sempre più fruibili al grande pubblico della Rete, presto Liquida
sarà navigabile a matrice, sia per categorie editoriali (sport, cinema etc..),
sia per aree geografiche (città, regioni, stati). Tutti questo è reso possibile
dall’utilizzo della semantica. Il lavoro è ancora lungo ma l’entusiasmo non ci
manca.”

Liquida è un termometro del nostro pensiero e un valorizzatore dei nostri contenuti. Un ‘filtro’ che funziona come una lente di ingrandimento sul pensiero collettivo del
mezzo milione di blogger attivi oggi in Italia. 

Filtra e poi fa emergere i loro
pensieri e la loro espressione organizzandola per temi, argomenti, tag e related.

Liquida si colloca in uno spazio competitivo in cui operano molti
altri aggregatori di contenuti, Digg, Technorati, Delic.io.us e Wikio, ma con
un focus e un metodo diversi.

Mentre Technorati definisce la qualità dei blog
automaticamente in base a dati quantitativi (il numero dei cross link), Liquida
opera in modo analogo a Digg. La selezione delle notizie è effettuata dando un
voto (aka karma) da parte di un essere umano. Nel caso di Digg sono gli utenti
stessi a decidere il karma, per Liquida è la sua redazione a fare lo screening
ed assegnare un giudizio di valore sul contenuto.

La selezione delle fonti blog è effettuata dando più voti,
che compongono un primo “karma” da parte di un essere umano ad ogni
singola fonte. E’ un po’ come dire usare un ‘umano’ come primo decoder del
valore di un’informazione che da input alla macchina semantica e assegnando un
valore ‘qualitativo’ – un rating di ingresso. Un umano non solo la fa passare
dal filtro, ma anche assegna al post che in questo momento sto scrivendo, una
sorta di giudizio di valore e un senso leggibile dalle macchine.

Superato questo filtro i post giungono al sistema dove i computer li tritano con un motore semantico e statistico allo scopo di arricchire le
informazioni in possesso per ogni post (ad esempio: categorie, entity, tag,
lingua, tipologia etc..) e di attribuirne uno o più parametri di qualità.

Questo parametro di qualità è quello che, a regime,  dovrebbe garantire al visitatore un
elevato grado di soddisfazione rispetto ai risultati che gli vengono proposti.

Lanciato a Luglio del 2008, nel giro di un semestre Liquida
ha categorizzato 20.000 blog e 3 milioni di articoli, ma la cosa più
impressionante è il successo di utenti dell’applicazione: 1,5 milioni di
visitatori unici in base ai dati Nielsen, che vengono mediamente circa 3 volte
al mese sul sito.   

Una delle informazioni ‘di contorno’ più interessanti che
emergono da Liquida è la comprensione di quali sono i temi più popolari e discussi
dai blogger. Dalle statistiche di Liquida infatti emerge una sorta di sintesi
del pensiero collettivo.

Nel 2008 i temi più discussi sulla blogosfera Italiana sono
stati quelli di politica interna e attualità (30%), tecnologia e web (20%),
politica internazionale (10%) e sport (8%).

I due personaggi più citati sono stati Berlusconi  e Obama.

Sarà interessante quando la tecnologia semantica di Liquida comincerà
ad agganciare a queste informazioni puramente quantitative, anche un dato
qualitativo.

Non dovrebbe essere particolarmente complicato ad esempio
collegare un giudizio positivo e negativo a tutti i post, commenti e tag che
contengono la parola Berlusconi o la parola Obama: basterebbe un’analisi
semantica degli aggettivi di tutti i contenuti che contengono le due parole.

Questo piccolo ‘add-on’ consentirebbe di misurare e
conoscere continuamente ed in tempo reale il vero giudizio della gente sul loro
operato e non quello di sondaggi e sondaggisti, troppo spesso discutibili in
termini di metodologia e risultati.

Analizzando i dati attuali, e in particolare le prime dieci
parole più citate del 2008 emerge che Berlusconi risulta 2,5 volte più discusso
di Veltroni, che viene superato anche dal Ministro Gelmini. Seguono poi i
ministri: Tremonti, Brunetta e Carfagna. Il secondo politico più ricorrente del
centro sinistra rimane ancora Prodi. Sarei molto curioso di conoscere gli
aggettivi collegati a ognuno di questi personaggi. Nel complesso il centro
sinistra si prende la rivincita tra i partiti, con il Pd molto più citato del Pdl
e  seguito dall’UDC.

Negli ultimi mesi dell’anno i temi di attualità più discussi
sono stati: la riforma Gelmini, la crisi economica, la sicurezza e la criminalità,
le guerre e il terrorismo. Molto spazio è riservato ai temi legati al Vaticano
dove ricorrono termini come: Chiesa, il Papa, il Vaticano e la Bibbia.

Per quanto riguarda il web il nuovo  leader è Facebook, seguito da Youtube e
da Google e nella tecnologia la sfida è fra Apple, il vero protagonista della
Rete, e Microsoft.  Apple è molto
presente sia come brand che con tutti i sui prodotti, in particolare l’iPhone,
l’iPod e il Macbook. La sua leadership è combattuta con Microsoft e in
particolare con i prodotti della famiglia Windows.

La classifica dei brand aziendali vede in cima Apple,
seguito da Google, Alitalia per le ben note vicende, Microsoft e la Ferrari.

Lo sport è dominato dal Calcio. La parola di sport in assoluto
più frequente è Milan, seguita, quasi a pari merito, da Inter. La vera star è
Mourinho che supera in fama anche i calciatori. Il Milan può vantare anche il
primato del giocatore in assoluto più citato Ronaldinho, mentre il calciatore italiano
più citato è Totti, seguito dal Del Piero. Fuori dall’ambito calcistico la
leadership spetta a Valentino Rossi.

Fra i personaggi dello spettacolo la più famosa è una donna,
Maria de Filippi, che supera di poco l’altra grande presentatrice Simona
Ventura. Citatissimi anche Roberto Saviano, Beppe Grillo, Vladimir Luxuria,
Britney Spears e Marco Travaglio.

L’informazione oggi è Liquida, ma soprattutto il pensiero
collettivo degli Italiani è sempre più visibile e accessibile. Può essere
misurato, contato. Si può capire come il ‘mood’ collettivo del blogger si sta
direzionando. 

Questo oggi è il pensiero dei blogger italiani. Milioni di persone. Come sarà domani?

Nelle ultime due settimane ho incontrato  altre due startup che lavorano su temi
del tutto analoghi ma con angoli diversi. 

Usare la grande macchina interattiva che ci collega oggi digitalmente per conoscere e comprendere i mood
delle folle. Di nazioni, di gruppi di persone, di social networks.  

Strumenti per prevedere il verificarsi di determinati eventi
in base all’andamento delle comunicazioni nel loro network sociale. In Italia Human Highway ha lanciato Vedrete.

Annunci

3 commenti on “L’informazione generata dagli utenti è Liquida”

  1. Gianluca Gindro ha detto:

    Iniziativa davvero interessante. Riusciremo mai a liberarci dai media che ci filtrano e ci presentano le informazioni già “indirizzate”?
    A mio avviso però prima di riuscire a utilizzare strumenti di web semantico per capire a 360 gradi l’opinione della gente ci mancano ancora un po’ di passi:
    – per quanto parecchi milioni, i blogger sono un sottoinsieme molto particolare della popolazione… difficile quindi da utilizzare come campione. C’è da dire però che questo sicuramente andrà ad attenuarsi negli anni con l’estendersi dell’uso della rete…
    – Liquida: il fatto di centralizzare uno step del processo, ovvero il ranking della qualità, non è un po’ contro la filosofia del “dare potere agli utenti”?
    – Sarebbe interessante confrontare queste percentuali con quelle dei media tradizionali. Quello che però mi verrebbe da dire è che oggi i media tradizionali oggi hanno un potere ancora così forte in confronto ai blog, che le informazioni presenti nei blog spesso sono lo specchio di quello che dicono giornali e TV
    In ogni caso, idea veramente interessante… non vedo l’ora di vederne l’evoluzione!
    Ciao,
    Gianluca

  2. dgiluz ha detto:

    Davvero trovi? Secondo me i media tradizionali hanno impatto, ma sempre meno e prevalentemente su certe fasce di popolazione (diciamo over 50). Ultimamente sono usciti i dati di PEW sui media, che parlano chiaro:
    http://pewresearch.org/pubs/1066/internet-overtakes-newspapers-as-news-source
    Se si chiede alla nuova generazione di digital natives, un media non manipolabile è per loro un non-sense, noioso e decisamente poco comprensibile:
    http://gianlucadettori.nova100.ilsole24ore.com/2008/12/interviste-a-na.html

  3. Gianluca Gindro ha detto:

    Ho visto il video… però poi alla fine ammette “We are only at the very beginning of a revolution in the telecom and media space”.
    Siamo tutti d’accordo che c’è una trasformazione in atto, ma a che punto siamo?
    E per il primo articolo che dice che internet ha superato i giornali: cosa hanno messo dentro la categoria internet? Perchè se c’è anche l’equivalente americano di corriere.it, mi sembra più una questione di mezzo che di new media (anche se quando c’erano le manifestazioni studentesche corriere.it doveva mettere i link a youtube per fare vedere cosa stava realmente accadendo!!)


Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...