Google usa YouTube per allenare la sua AI, ma i creator non lo sanno
Google ha confermato che l’enorme libreria video di YouTube viene usata per addestrare i suoi modelli IA, come Gemini e Veo. Ma non c’è possibilità di opporsi alla decisione

Il consenso all’addestramento dell’IA è un tema centrale nel dibattito sull’uso etico dei dati. Significa che le persone dovrebbero avere il diritto di sapere e decidere se le proprie informazioni vengano utilizzate per istruire modelli di intelligenza artificiale. Un caso recente è quello di Meta, l’azienda madre di Facebook e Instagram, che aveva annunciato l’intenzione di usare i contenuti pubblicati dagli utenti — come testi, immagini e interazioni — per addestrare i propri modelli di IA, dando poi la possibilità di opporsi a questa decisione. Ora al centro del dibattito c’è invece Google, che ha recentemente confermato di utilizzare i video di YouTube per addestrare i suoi modelli IA.
Addestrare la IA con YouTube: cosa sta facendo Google
Secondo le informazioni rese pubbliche di recente, la vastissima libreria di video presenti su YouTube (contiene circa venti miliardi di video) viene in parte usata da Google per addestrare i suoi più avanzati modelli di intelligenza artificiale, come Gemini e Veo. Ma cosa vuol dire esattamente?
Allenare o addestrare un’intelligenza artificiale significa fornire grandi quantità di informazioni al modello IA, in modo che possa imparare a svolgere un compito specifico, come riconoscere immagini, tradurre testi, generare video o rispondere a domande.
Queste informazioni sono solitamente dati (come testi, immagini, audio, video) e algoritmi di apprendimento automatico (machine learning). I dati devono essere numerosi, vari e di buona qualità, perché l’efficacia del modello dipende direttamente dalle informazioni su cui è stato addestrato.
L’allenamento è dunque una fase fondamentale, perché determina quanto sarà precisa l’IA nel suo funzionamento. Senza un addestramento adeguato, l’IA non è in grado di comprendere o gestire compiti complessi.
Training IA di Google con i video YouTube, è possibile negare il consenso?
Un portavoce di YouTube ha dichiarato che i contenuti di YouTube vengono da sempre usati «per migliorare i nostri prodotti, e questo non è cambiato con l’avvento dell’AI». La notizia ha però generato dello sconcerto e del malcontento tra i creator, che in molti casi hanno dichiarato di non essere a conoscenza del fatto che i loro video venissero usati per addestrare le IA. Inoltre, non c’è la possibilità di opporsi alla decisione.
YouTube offre infatti ai creator la possibilità di escludere i propri video dall’addestramento da parte di società terze, come Amazon o Nvidia. Non è però prevista un’opzione per impedire a Google stesso di utilizzare quei dati: a YouTube viene garantita un’ampia licenza d’uso nel momento in cui, cariando un video, si accettano i termini di servizio della piattaforma.
Immaginando che anche solo una piccola parte del totale di video di YouTube – ad esempio l’1% – venga utilizzata da Google per il traning AI, si tratterebbe comunque di una quantità di materiale di addestramento varie decine di volte superiore a quella utilizzata da altri modelli AI concorrenti.
Il paradosso è che ora Veo, addestrato con molti contenuti pubblici e originali di YouTube, è in grado di generare contenuti video iperrealistici e verrà integrato proprio su YouTube. In pratica, la piattaforma che ha ospitato per anni il lavoro creativo di milioni di persone dovrebbe ora promuovere video generati da IA potenzialmente in concorrenza con gli stessi creator umani che ne hanno alimentato l’addestramento.