SMART EVOLUTION

OpenAI annuncia: bastano 15 secondi per rubarci la voce

Voice Engine è la nuova tecnologia di OpenAI che consente di generare una voce sintetica partendo da un audio di 15 secondi

Pubblicato: 2 Aprile 2024

Davide Raia

Tech editor

Editor e copywriter, ha collaborato con importanti realtà editoriali italiane e si occupa principalmente di tecnologia, in tutte le sue forme. Appassionato di viaggi, vive tra Napoli e la Grecia.

La nuova creazione di OpenAI si chiama Voice Engine e, come suggerisce il nome, è un modello di deep learning che, sfruttando l’intelligenza artificiale, riesce a clonare la voce di una persona. Basta fornire un campione di audio da 15 secondi per consentire a Voice Engine di “fare il suo lavoro” e creare così una voce sintetica molto simile, per non dire identica, a quella originale. Questa nuova tecnologia potrà trovare tanti campi di applicazione. Molti di questi sono, però, potenzialmente pericolosi.

OpenAI svela Voice Engine

Con un post sul blog ufficiale, OpenAI ha annunciato il debutto del nuovo modello Voice Engine, disponibile per il momento come anteprima solo per un numero ristretto di sviluppatori. Con Voice Engine è possibile creare una voce sintetica partendo da un input di testo e da un singolo campione audio da 15 secondi.

La voce generata ha un parlato naturale molto simile a quello della voce originale utilizzata come campione. Gli esempi pubblicati da OpenAI sono davvero impressionanti. Partendo da un audio di appena 15 secondi, infatti, Voice Engine può creare audio in grado di replicare l’intonazione, il timbro e altre caratteristiche della voce originale.

La presentazione di questa nuova tecnologia è accompagnata da vari esempi di utilizzo delle voci sintetiche, utili per fornire assistenza alla lettura, tradurre contenuti e in molti altri contesti. Da notare che OpenAI ha confermato di aver sviluppo Voice Engine già sul finire del 2022, inizialmente per lo sviluppo dell’API di sintesi vocale e per ChatGPT Voice.

Al momento, non sono chiare le reali capacità di questo modello. OpenAI evidenzia la capacità generativa di Voice Engine considerando un campione audio di 15 secondi. Fornendo al sistema uno o più campioni audio (della stessa voce) di durata più lunga, il modello potrebbe essere in grado di ottenere risultati ancora più vicini all’originale, tanto da risultare indistinguibile.

I rischi di questa tecnologia

Senza troppi giri di parole, un modello di deep learning in grado di generare una voce sintetica identica al campione di partenza si presta facilmente a un utilizzo improprio. La possibilità di clonare la voce di una persona, senza il suo consenso, è una delle conseguenze negative di questa tecnologia, potenzialmente utilizzabile per truffe e raggiri di vario tipo, colpendo sia personaggi pubblici che persone comuni.

OpenAI ha confermato di aver adottato un approccio “cauto“ in merito al rilascio di una versione completa del suo modello, proprio a causa dei rischi legati all’uso improprio di questa tecnologia. Sul blog si legge: “Speriamo di avviare un dialogo sull’impiego responsabile delle voci sintetiche e su come la società può adattarsi a queste nuove capacità“.

Secondo OpenAI è necessario puntare all’eliminazione graduale dei sistemi di autenticazione vocale, come misura di sicurezza adottata per la verifica dell’identità, ed accelerare lo sviluppo e l’adozione di tecniche in grado di tracciare l’origine dei contenuti audiovisivi che, in futuro, dovranno essere facilmente identificabili quando includono elementi generati tramite AI.

TAG:

INNOVAZIONE

Ti suggeriamo

Affariesteri.it

Riarmo: è giusto diferndersi?
Lo scenario in Europa e le opportunità per l'Italia

OpenAI annuncia: bastano 15 secondi per rubarci la voce

OpenAI svela Voice Engine

I rischi di questa tecnologia

Affariesteri.it

Riarmo: è giusto diferndersi?

Ti potrebbero interessare

I chatbot di Meta diventano proattivi e contatteranno direttamente gli utenti

Guida completa al Metaverso: cos'è e come funziona il mondo virtuale

Amazon ha un milione di robot al suo servizio, cosa cambia per l'e-commerce

Google porta in Italia Veo 3, il modello AI per la generazione di video

Il CID diventa digitale, la rivoluzione parte il 1° luglio 2025

I più letti di Libero Tecnologia

Una nuova scoperta, la Terra sta iniziando a girare più velocemente

Amazon Prime Day, le offerte di oggi 10 luglio da non perdere

Amazon, questo smartphone è da comprare subito: 80% di sconto

Le balenottere del Mediterraneo stanno assumendo sostanze tossiche, l'allarme

Dyson, prezzo crollato per il robot aspirapolvere: sconto esclusivo Amazon

Le migliori occasioni scelte per te

Amazon, l'iPhone al minimo storico e sconti fino al 90%: le migliori offerte di oggi

Motorola, lo sconto è eccezionale: questo smartphone va comprato subito

AirPods 4 al minimo storico: vanno comprate subito su Amazon

Sennheiser ACCENTUM, prezzo super per le cuffie wireless al Prime Day

POCO C75, col Prime Day di Amazon è un affare senza precedenti