I social network potranno leggere il futuro (dei consumatori)?

par Daniele Vital
giovedì 23 febbraio 2012

Dopo Foursquare (spazio fisico) e Facebook timeline (tempo, al passato), quale dimensione ci rimane in cui poter conservare un pò di imprevedibilità? Il futuro? Qualcuno ci sta lavorando… Sono gli esperti in Data Mining. Una evoluzione dell'Information Technology con l'obiettivo di trasformare dati in conoscenza.

Il numero di dati che si sta accumulando sul comportamento degli utenti ha raggiunto una quantità enorme al punto che è già possibile creare dei modelli per predire le probabilità dei comportamenti online. Gli algoritmi di data mining - un insieme di tecniche matematiche, statistiche e di intelligenza artificiale - hanno l'obiettivo di trovare dei pattern (insiemi) nei dati per poi creare dei modelli per predire un avvenimento con il verificarsi di nuovi dati. C'è ancora molta strada da fare per arrivare ad avere dei modelli accurati e precisi. Per il momento ci salva il noise (rumore nei dati).

Nel caso specifico del comportamento umano online, il noise è l'effetto della complessità di tanti fattori esterni che influenzano le nostre scelte. Le dinamiche e le variabili in gioco sono talmente complesse che ridurre tutto ad una forma matematica è estremamente difficile se non sfiora addirittura l'impossibile.

Per esempio, un errore che si fa spesso in statistica è non considerare che 'correlation dose not imply causation': una relazione tra due variabili non implica necessariamente un rapporto di casualità tra le due variabili stesse (quindi non è detto che una sia la causa dell'altra). Entrambi potrebbero essere legate ad un fattore comune che può essere la causa sorgente. Analizzando i dati della città di Chicago, esiste una correlazione negativa tra l'attività criminale ed il consumo di cioccolata calda. Questo significa che per ridurre il crimine bisogna consumare più cioccolata calda? Fortunatamente la polizia di Chicago non la pensa così. Esiste infatti un terzo fattore che è la causa sorgente di entrambi: l'inverno gelido con temperature ampiamente sotto lo zero centigradi che rallenta ogni attività, anche quella criminale, e stimola i cittadini al consumo di cioccolata calda.

Quello che oggi è possibile, però, è avere dei numeri estremamente alti di dati. Quando si ha un training set - i dati a disposizione che si utilizzano per trovare il pattern da cui costruire il modello - con un numero molto alto di dati si riescono comunque a trovare dei pattern significativi nonostante tutto il noise. Per esempio i 'frequent pattern algorithm' sono algoritmi molto semplici che cercano di trovare combinazioni di prodotti o comportamenti ed azioni che accadono frequentemente assieme (per esempio il 'market basket analysis' di Amazon che consiglia al compratore ulteriori prodotti segnalando gli acquisti di altri utenti che hanno comprato lo stesso prodotto del compratore).

Uno sviluppo che se non hanno già intrapreso sarà sicuramente il prossimo passo per questi algoritmi, è quello di integrare nei modelli predittivi non solo i dati dell'utilizzatore (user), ma anche i dati del suo network (probabilmente recuperati da facebook o simili) per migliorarne l'accuracy predittiva.

Siamo ancora lontani dalla capacità di predire con esattezza i comportamenti degli utenti online, ma il valore dei dati raccolti non va più visto soltanto come analisi di ROI, CRM o real time feedback. Esistono grandi sforzi nella direzione del Data Mining in diversi settori e per chiunque voglia intraprendere un'avventura imprenditoriale nel mondo social media è importante non sottovalutare questo aspetto nel momento in cui si pianificano quali dati raccogliere dai propri utenti. Il futuro è a portata di mano. Anzi, per essere esatti, a portata di pattern.


Leggi l'articolo completo e i commenti