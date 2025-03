Attivo nel mondo dell’editoria sin dal 2011, giornalista dal 2019, ha lavorato per il web e per la carta stampata occupandosi di musica, cultura, lifestyle e tecnologia.

Alibaba ha presentato R1-Omni, un nuovo modello di intelligenza artificiale in grado di riconoscere e interpretare le emozioni umane all’interno dei video. L’azienda cinese ha pubblicato una breve dimostrazione su GitHub che mostra come questo strumento sia in grado di analizzare brevi clip video, identificando lo stato emotivo dei soggetti, combinando analisi visiva e audio.

Con l’introduzione di questo nuovo modello, l’obiettivo del colosso cinese dell’e-commerce è, dunque, quello di dare alle macchine la capacità di interpretare gli stati emotivi umani e rispondere di conseguenza, per (future) interazioni più naturali ed empatiche.

Come funziona R1-Omni

R1-Omni si basa sul modello open-source HumanOmni-0.5B, sviluppato dal ricercatore Jiaxing Zhao e utilizza un approccio multimodale per il riconoscimento delle emozioni.

Il modello è in grado di rilevare le micro-espressioni e variazioni nei tratti del volto per identificare emozioni come gioia, tristezza, rabbia e sorpresa.

Analizzando il linguaggio del corpo come la postura e i movimenti per comprendere stati emotivi più complessi, come disagio, insicurezza o entusiasmo.

Attraverso le variazioni del tono della voce come cambiamenti nel timbro, ritmo e intonazione, è in grado di interpretare le emozioni anche quando l’espressione facciale è neutra.

Infine, grazie all’elaborazione del linguaggio naturale il modello riesce a comprendere il contenuto parlato e scritto per contestualizzare le emozioni espresse nelle conversazioni.

Come già anticipato, al momento questo tool è in grado di esaminare brevi video e riconoscere gli stati emotivi dei soggetti ripresi. In futuro, quando il modello sarà perfezionato ulteriormente, il suo utilizzo potrebbe diventare ancora più specifico

Il futuro dell’intelligenza artificiale

Con l’arrivo di R1-Omni Alibaba cerca di rendere le interazioni uomo-macchina più fluide ed empatiche.

Per il futuro, un tool del genere potrebbe dare vita ad assistenti AI più intuitivi e reattivi, in grado di adattare le risposte in base allo stato emotivo dell’utente.

Anche nel settore della telemedicina e supporto psicologico potrebbe portare grandi benefici, con diagnosi più accurate e interazioni più umane nei servizi sanitari

Oltre a questo, l’uso di R1-Omni potrebbe portare anche alla creazione di contenuti personalizzati in base alle reazioni emotive dell’utente da utilizzare sui social.

La strategia di Alibaba, insomma, mira a sviluppare l’AGI, un’intelligenza artificiale generale con capacità cognitive molto simili a quelle degli esseri umani e l’introduzione di questo nuovo modello rappresenta un passo importante in questa direzione.

In futuro è molto probabile che modelli come R1-Omni diventino molto più frequenti ma questo primo tentativo messo in atto dal colosso cinese dell’e-commerce segna un’evoluzione importante nel modo in cui le macchine comprendono e rispondono alle emozioni umane, aprendo nuove possibilità per il futuro dell’interazione tra l’essere umano e queste tecnologie.