Cosa sono e da dove provengono i big data
Con Big Data ci si riferisce a grandi masse di dati difficili da gestire con sistemi tradizionali: scopri cosa sono e da dove provengono.
In statistica e informatica, la locuzione inglese big data – “grandi masse di dati”, o in italiano megadati – indica genericamente una raccolta di dati informativi così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l’estrazione di valore o conoscenza. Così la letteratura spiega i big data cosa sono e a cosa servono, utilizzando termini che potrebbero suonare fin troppo tecnici per i non addetti ai lavori. Di fatto, si tratta di una delle evoluzioni più profonde e pervasive del mondo digitale, per altro destinata a durare nel tempo e ad incidere profondamente sulla nostra vita quotidiana e sulle attività produttive delle imprese.
Un’influenza, questa, che è possibile percepire tutti i giorni, e che ha praticamente modificato radicalmente tante delle attività basilari della nostra esistenza. Così come il mondo che ci circonda. Ecco perché, soprattutto negli ultimi venti anni, si sente sempre più spesso parlare di megadati sulla stampa cartacea e online, a maggior ragione sulle pagine dedicate a marketing e IT. In questa guida scopriremo allora insieme il loro valore, per cosa vengono utilizzati e da dove possono provenire i big data.
Big Data: cosa sono e a cosa servono
Quello dei big data è un trend non solo potente ma, come già accennavamo, pure destinato a perdurare nel tempo. Per altro andando a migliorare costantemente dal punto di vista applicativo. Il termine, lo avrete capito, viene utilizzato in riferimento alla capacità – propria della scienza dei dati – di analizzare, estrapolare e mettere in relazione una grandissima mole di dati eterogenei, strutturati e non strutturati. Il tutto grazie a sofisticati metodi statistici e informatici di elaborazione, con l’obiettivo di scoprire i legami e le correlazioni tra fenomeni diversi e prevedere di conseguenza quelli futuri.
Per fare qualche esempio, dal punto di vista imprenditoriale, i big data possono essere utilizzati per diversi scopi, tra cui quello di misurare le prestazioni di un’organizzazione o di un processo d’azienda. Nel quotidiano invece, per comprendere appieno i big data cosa sono, possiamo pensare a quando interagiamo sui social network, alla navigazione su un qualsiasi sito web, o agli smartphone più moderni praticamente sempre interconnessi, senza dimenticare la carte di credito usate per gli acquisti, la televisione, gli storage necessari per le applicazioni dei computer, le infrastrutture intelligenti delle città, fino ai sensori montati sugli edifici e sui mezzi di trasporto pubblici e privati.
In tutti questi casi, ci troviamo di fronte ad una mole di dati generata seriamente impressionante, e ovviamente molto più elevata rispetto a quella di qualche decennio fa. Oggi, grazie ai big data possono essere analizzati in tempo reale. In aggiunta, anche gli esseri umani sono diventati nel tempo delle sorgenti di dati, così come una loro quantità non indifferente viene creata lungo la catena del valore di qualsiasi settore industriale. Nel 2011 Teradata afferma che “Un sistema di big data eccede/sorpassa/supera i sistemi hardware e software comunemente usati per catturare, gestire ed elaborare i dati in un lasso di tempo ragionevole per una comunità/popolazione di utenti anche massiva”.
Un’ulteriore proposta di caratterizzazione dei big data è stata data dal McKinsey Global Institute: “Un sistema di Big Data si riferisce a dataset la cui taglia/volume è talmente grande che eccede la capacità dei sistemi di database relazionali di catturare, immagazzinare, gestire ed analizzare”. In realtà, la sola definizione di big data non è sufficiente per offrire un quadro completo e ottimale di un fenomeno tanto rilevante. Non significa infatti limitarsi a parlare di grandi moli di dati: a cambiare è stato anche il processo di raccolta e gestione dei dati, e si sono evolute le tecnologie a supporto del ciclo di vita del dato e per la sua stessa valorizzazione.
La grande rivoluzione a cui ci si riferisce parlando di big data è quindi soprattutto la capacità di usare tutte queste informazioni per elaborare, analizzare e trovare riscontri oggettivi su diverse tematiche. Ciò si traduce in cosa si può fare con tutta questa quantità di dati, ossia gli algoritmi capaci di trattare così tante variabili in poco tempo e per altro con poche risorse computazionali a disposizione – magari addirittura un semplice laptop per accedere alla piattaforma oggetto di analisi. I grandi dati, ad essere più semplici, presuppongono nuove e più affinate capacità di collegare tra di loro le informazioni per andare a fornire un approccio effettivamente visuale ai dati, suggerendo pattern e modelli di interpretazione fino ad ora neanche immaginabili.
I big data, poi, sono generalmente definiti da tre V. La prima, trattandosi di dati molto grandi, è proprio il Volume, ovvero sia la quantità di dati (strutturati o non strutturati) generati ogni secondo da sorgenti eterogenee – per citarne alcune, possiamo pensare ai sensori, ai log, alle email, ai GPS, ai social media e ai database tradizionali. Abbiamo anche la Varietà, che si riferisce alla differente tipologia dei dati che vengono generati, accumulati ed utilizzati, seguita infine dalla Velocità – in quanto i big data sono prodotti in tempo reale. Con il tempo, sono state introdotte una quarta V, quella di Veridicità, e poi una quinta, quella di Valore. Insomma, una rivoluzione fatta e – non – finita che tocca da vicino la vita di ogni singola persona senza che nessuna se ne accorga.
I diversi utilizzi dei Big Data
Analizzare grandi moli di dati permette di generare nuova conoscenza utile per prendere decisioni più consapevoli, non solo in ambito business. Ora che sappiamo i big data cosa sono e a cosa servono, è altrettanto necessario essere consapevoli di come vadano ad essere impiegati in diversi settori. Tutto ciò è reso possibile e completamente abbordabile da tecnologie che consentono di gestire dati destrutturati e processare ampi volumi di dati in tempo reale, ma anche grazie alla diffusione di algoritmi più sofisticati e di metodologie di analisi ampiamente innovative.
Questi strumenti possono e devono estrapolare autonomamente le informazioni nascoste nei dati. Traducendosi per l’appunto in potenzialmente infinite applicazioni, visibili ogni giorno nel mondo moderno. Prima di tutto nel marketing, i megadati trovano il loro utilizzo più utile e diffuso, venendo largamente impiegati nella costruzione dei cosiddetti metodi di raccomandazione, come quelli utilizzati dai giganti dell’intrattenimento e dell’eCommerce – Netflix e Amazon, per citarne alcuni – per fare proposte di acquisto sulla base degli interessi di un cliente specifico rispetto a quelli di milioni di altri. Null’altro che una personalizzazione dell’offerta più precisa e puntuale rispetto a quella messa in atto dalle aziende solo una manciata di anni fa.
La percezione e la successiva riduzione delle frodi è un altro esempio di come i big data possono essere utilizzati nel quotidiano e possono creare di conseguenza del valore produttivo e migliorare qualsiasi tipo di esperienza per gli utenti di un servizio o di una piattaforma. Aziende leader nelle carte di credito, come Visa o American Express, analizzano non a caso ogni giorno miliardi di transazioni da ogni parte del mondo per identificare movimenti e pattern insoliti, in modo da abbassare sensibilmente il numero e l’incidenza delle frodi in tempo reale.
Non mancano neppure utilizzi dei big data nella cosiddetta manutenzione predittiva. Con questo termine, ci si riferisce a quelle aziende che sfruttano i dati raccolti sulle operazioni per analizzare le prestazioni e predire la possibile esistenza di problemi futuri prima che questi accadano. Gli esperti hanno osservato che le aziende leader nei big data sono capaci di generare in media il 12% di profitto in più rispetto alle aziende che non sfruttano il valore di questi dati protagonisti del nostro tempo.
Nella sfera pubblica, poi, ci sono tantissimi altri tipi di applicazioni per i big data: negli ultimi anni, le forze di polizia utilizzano grandi quantità di dati in tempo reale per prevedere dove e quanti reati hanno una maggiore probabilità di verificarsi; si sono moltiplicati studi più precisi da parte della associazioni preposte nella correlazione tra salute e qualità dell’aria che respiriamo; c’è poi la possibilità di svolgere un’analisi genomica per migliorare la resistenza alla siccità delle colture di riso; o ancora la creazione di modelli per analizzare i dati provenienti dagli essere viventi nelle scienze biologiche e nella ricerca medica, sia diagnostica che farmacologica.
Naturalmente, in tutti questi ambiti è assolutamente vitale che l’impiego legittimo dei big data sia regolamentato a fronte dell’incredibile valore che in essi stessi risiede. L’impego illegittimo o eccessivamente invasivo dei dati può compromettere, nei casi meno gravi, la fiducia dei clienti nei confronti dell’operato delle aziende. In quelli più pesanti, invece, possono causare danni ai cittadini – che possono essere pazienti, votanti e consumatori -, ovvero quello che viene definito come l’anello più debole della catena del valore. Come rimarcato dalla letteratura d’impresa e dalla normativa, nelle tutele dei singoli individui rientrano il diritto alla privacy e le libertà individuali: al fine di garantire le suddette tutele, le attività di controllo e di sanzione delle Agenzie Governative preposte è necessario che siano rafforzate e adeguate con strumenti normativi e finanziari più all’avanguardia.