Libero
DIGITAL LIFE

Cos'è e come viene usato il deep learning

In questo articolo scopriremo che cos'è il deep learning, per quale scopo viene utilizzato, in che modo funziona e quali sono le sue principali applicazioni.

cos'è il deep learning Fonte foto: Shutterstock

Utilizzare Siri o un qualsiasi assistente vocale, di questi tempi, è entrato nel nostro quotidiano per svolgere le più svariate attività in modo semplice e rapido. Non tutti sanno però che, quando sfruttiamo le potenzialità di questi strumenti, ci stiamo di fatto approcciando al deep learning. Un termine, questo, reso nella nostra lingua come apprendimento profondo, alcuni lo chiamano apprendimento gerarchico, e che è legato a doppio filo al concetto di machine learning e, più in generale, a quello di intelligenza artificiale, o AI, dall’inglese Artificial Intelligence. Se il machine learning è un ramo specifico dell’intelligenza artificiale, allo stesso modo la tecnologia in esame in questa nostra guida è un sottoinsieme della prima, e sottende a qualcosa di molto più ampio del semplice apprendimento su più livelli delle macchine. Di conseguenza, come già dicevamo, le applicazioni sono innumerevoli, e andremo naturalmente a scoprire insieme le principali nei prossimi paragrafi.

La definizione di deep learning

La definizione tecnica di deep learning o di apprendimento profondo è quella di una classe di algoritmi di apprendimento automatico, vale a dire il campo di ricerca dell’apprendimento automatico, il già citato machine learning, e dell’intelligenza artificiale che si basa su diversi livelli di rappresentazione, corrispondenti a gerarchie di caratteristiche di fattori o concetti, dove i concetti di alto livello sono definiti sulla base di quelli di basso. La definizione dell’Osservatorio Artificial Intelligence del Politecnico di Milano è ancora più comprensibile dai non addetti ai lavori: l’apprendimento profondo viene infatti descritto come un insieme di tecniche basate su reti neurali artificiali organizzate in diversi strati, laddove ogni strato calcola i valori per quello successivo di modo che l’informazione venga elaborata in maniera sempre più completa.

Non è un caso allora che tra le architetture di apprendimento profondo vengano ricordate solitamente le reti neurali profonde, la convoluzione di reti neurali profonde, le deep belief network, e reti neurali ricorsive. Tutte rappresentano un approccio secondo il quale l’apprendimento avviene grazie a dati ottenuti tramite algoritmi, prevalentemente di calcolo statistico.

Avrete quindi capito che la gran mole di dati elaborate dalla reti neurali compie un “percorso” molto simile a quello che avviene nel cervello umano, a cui si ispira il funzionamento delle stesse reti artificiali. Tanti sono i ricercatori e gli scienziati noti per il loro impegno nell’apprendimento profondo, come Andrew Yan-Tak Ng, tra le altre cose fondatore di Google Brain, Ian J. Goodfellow, riconosciuto come uno dei migliori innovatori del mondo under 35 dal MIT di Boston, Yoshua Bengio, Ilya Sutskever, e Geoffrey Everest Hinton, una delle figure chiave nell’intelligenza artificiale.

Proprio il loro contributo, ci permette oggi di definire il deep learning come un sistema che sfrutta una classe di algoritmi di apprendimento automatico che, prima di tutto, usano diversi livelli di unità non lineari a cascata per svolgere compiti di estrazione di caratteristiche e di trasformazione, con ciascun livello successivo ad utilizzare l’uscita del livello precedente come input. Gli algoritmi, poi, si basano sul cosiddetto apprendimento non supervisionato di livelli gerarchici multipli di caratteristiche dei dati, creando una rappresentazione gerarchica. Non solo, per come sono stati concepiti, apprendono multipli livelli di rappresentazione che corrispondono a differenti livelli di astrazione, generando di conseguenza una gerarchia di concetti.

Solo attorno al 2000 si è iniziato a parlare di deep learning. In relativamente poco tempo, però, i suoi utilizzi si sono moltiplicati a macchia d’olio grazie all’avanzamento tecnologico, e a reti neurali via via più sofisticate. I primi studi sulle reti neurali multistrato sono stati prodotti e pubblicati dallo scienziato giapponese Kunihiko Fukushima, che ha sviluppato nel 1975 il modello del cognitrone, seguito da quello del neo-cognitrone. Lo stesso studioso, ha introdotto l’idea di area di connessione per i neuroni che si è sviluppata nelle reti neurali convoluzionali.

Negli anni ’80 è poi proseguita in modo più decisa l’analisi delle reti neurali artificiali multistrato, ma solo nell’ultimo decennio, soprattutto grazie all’avvento dei Big Data e al superamento di determinate limitazioni, stanno mostrando tutte le loro potenzialità in una svariata gamma di settori. Oggi, i sistemi di apprendimento profondo, fra le tante altre utilità, permettono ad esempio di andare ad identificare oggetti nelle immagini e nei video, di trascrivere il parlato in testo, o di individuare e interpretare gli interessi degli utenti online, restituendo risultati di ricerca più vicini alle proprie esigenze specifiche.

Come funziona il deep learning

Come chiarito nel paragrafo precedente della guida, il deep learning basa tutto il suo funzionamento sulla classificazione e successiva selezione dei dati più rilevanti per giungere ad una conclusione il quanto più possibile ottimale. Un funzionamento che ricalca quello del nostro cervello biologico, vuoi per formulare la risposta corretta ad un quesito, vuoi per arrivare alla risoluzione di un problema specifico, vuoi ancora per dedurre un’ipotesi logica. Arrivando anche, in molti casi, a superare le prestazioni degli stessi esseri umani, alcuni di voi ricorderanno il celebre caso di AlphaGo, un software che nel 2016 ha battuto il campione mondiale di Go, diversi anni di anticipo rispetto alle previsioni.

L’apprendimento profondo si comporta così allo stesso modo del raziocinio umano, utilizzando però le reti neurali artificiali di cui dicevamo, ovvero modelli di calcolo matematico-informatici basati sul funzionamento delle reti neurali biologiche, a loro volta costituiti da interconnessioni di informazioni. Di fatto, una rete neurale è un sistema di tipo adattivo: può modificare la sua struttura, fatta di nodi e relative interconnessioni, basandosi tanto su dati esterni quanto su quelli interni, che vanno quindi a connettersi e ad attraversare la rete neurale durante la fase di apprendimento e di ragionamento.

L’apprendimento si fa allora di tipo sia automatico che “profondo”, dove per profondo si intende su più livelli. Questo genere di apprendimento si è dimostrato decisamente più potente delle tecnologie IA precedenti, tanto da meritarsi nell’ultimo periodo un’attenzione mediatica senza precedenti. Oltre che, giocoforza, scientifica ed economica. Non mancano di certo i limiti, ma il deep learning sa sicuramente farsi notare per la qualità dei risultati ottenuti, con un corrispettivo enorme vantaggio nell’imparare a risolvere complessi problemi di riconoscimento di schemi. Seppur la richiesta di capacità computazionali enormi possa rappresentare un limite, la scalabilità del deep learning all’aumentare dei dati disponibili e degli algoritmi è ciò che lo differenzia dal machine learning.

Il primo migliora infatti le sue prestazioni all’aumentare dei dati, mentre il secondo una volta raggiunto un certo livello di performance non è più in grado di affinare le proprie performance. Questo perché la rete neurale complessa apprende in modo autonomo come analizzare dati grezzi e come svolgere un certo compito. Il computer è così in grado di “imparare da solo”, senza istruzioni umane, dopo una fase di addestramento inziale. L’obiettivo finale è quello di risparmiare tempo e risorse, soprattutto nel lavoro di routine, che viene eseguito in modo molto più efficiente e rapido di qualsiasi persona, senza alcun tipo di sforzo e mantenendo un livello di qualità praticamente costante.

Le applicazioni del deep learning

In questo settore sono stati compiuti passi da gigante, per quanto ancora oggi alcune delle decisioni nell’ambito del deep learning non sono del tutto comprensibili dal punto di vista squisitamente umano. Ciò non impedisce, come ormai chiaro, di migliorare costantemente le tecnologie legate all’apprendimento profondo, maggiormente grazie alla quantità di dati a disposizione e per la disponibilità di infrastrutture ultra performanti, il riferimento, in particolare, è a CPU e GPU. Non dovrebbe stupire che il deep learning sia attualmente applicato in vari settori industriali, e soprattutto che continuerà ad esserlo e ad espandersi in molti altri ambiti della nostra vita quotidiana nel prossimo futuro. Proviamo a pensare, solo per citare qualche caso concreto, alle auto senza conducente, ai robot droni per la consegna di pacchi, al riconoscimento e sintesi vocale e linguistica per chatbot e robot di servizio, o al riconoscimento facciale per questioni di sicurezza.

Non mancano poi applicazioni mediche in radiologia per individuare precocemente alcune forme di tumori, o la possibilità di individuare facilmente le sequenze genetiche di alcune malattie per produrre farmaci più efficaci. Possiamo citare anche la colorazione automatica di immagini in bianco e nero, la traduzione simultanea, la classificazione degli oggetti in una fotografia, la generazione automatica della grafia e del testo, assieme alla divisione intuitiva in didascalie. Allo stesso modo, si è sviluppato pure il gioco automatico, con il sistema ad imparare in autonomia come giocare ad un determinato gioco. A chiudere, da non sottovalutare sono le capacità dell’apprendimento profondo nell’esporre irregolarità nelle attività di sistema grazie al loro apprendimento indipendente e continuo, in particolar modo per i pericolosi attacchi informatici o per le riprese video “intelligenti” installate negli aeroporti più all’avanguardia.

Detto questo, è comunque importante sottolineare che il deep learning non può e non deve essere la soluzione tecnologica migliore per ogni problema. Molti ricercatori, soprattutto negli ultimi cinque anni, sono convinti che prossimamente saranno individuati approcci più efficaci, e forse meno costosi, che renderanno obsoleto  l’apprendimento di taglio gerarchico basato sul funzionamento del cervello dell’uomo. Quasi fosse un fenomeno passeggero, ridimensionato a rappresentare solo una delle tante e incredibili! – manifestazioni dell’intelligenza artificiale.