Libero
TECH NEWS

Gemini Robotics, intelligenza artificiale e robotica insieme

Google ha adattato gli algoritmi AI di Gemini 2.0 al mondo della robotica, creando il modello di visione-linguaggio-azione (VLA) Gemini Robotics

Pubblicato:

gemini robotics Fonte foto: Deepmind

DeepMind, azienda del gruppo Alphabet (Google) che si occupa di AI, ha recentemente annunciato una svolta significativa nel campo della robotica con l’introduzione di Gemini Robotics.

Questa nuova iniziativa promette di infondere un livello avanzato di intelligenza artificiale nei sistemi robotici, aprendo scenari inediti per applicazioni sia industriali che domestiche.

L’annuncio ha suscitato grande interesse nel settore tecnologico, prefigurando una potenziale trasformazione nel modo in cui i robot interagiscono con il mondo fisico e supportano le attività umane.

Che cos’è Gemini Robotics

Gemini Robotics rappresenta una nuova famiglia di modelli di intelligenza artificiale, fondati sull’architettura avanzata di Gemini 2.0. L’obiettivo primario è dotare i robot di capacità di ragionamento multimodale che spaziano tra testo, immagini, audio e video, estendendo queste abilità dal dominio digitale al mondo fisico.

Il modello principale, denominato semplicemente Gemini Robotics, è un modello di visione-linguaggio-azione (VLA) che integra le azioni fisiche come modalità di output, consentendo il controllo diretto dei robot. Questa integrazione permette ai robot di comprendere il mondo circostante e di reagire in modo appropriato per eseguire compiti concreti.

Un altro modello chiave introdotto è Gemini Robotics-ER (Embodied Reasoning), specificamente progettato per migliorare la comprensione spaziale dei robot.

Questo modello affina le capacità esistenti di Gemini 2.0, come il riconoscimento di oggetti tridimensionali e l’indicazione di punti nello spazio, permettendo ai robot di interpretare meglio l’ambiente che li circonda.

Grazie alla combinazione del ragionamento spaziale e delle capacità di codifica di Gemini, Robotics-ER può generare nuove abilità in tempo reale, come intuire la presa più adatta per sollevare un oggetto. In contesti operativi completi, Gemini Robotics-ER dimostra un significativo incremento nel tasso di successo rispetto a Gemini 2.0.

Le caratteristiche distintive di Gemini Robotics includono la generalità, ovvero la capacità di adattarsi a situazioni nuove e di eseguire un’ampia gamma di compiti non precedentemente appresi; l’interattività, che consente ai robot di comprendere e rispondere rapidamente a istruzioni e cambiamenti ambientali utilizzando un linguaggio naturale; la destrezza, che permette di eseguire manipolazioni complesse e precise di oggetti.

Quali aziende useranno Gemini Robotics

Google DeepMind sta collaborando attivamente con diverse aziende e istituzioni per esplorare e sviluppare ulteriormente le potenzialità di Gemini Robotics. In particolare, è stata annunciata una partnership con Apptronik per la costruzione della prossima generazione di robot umanoidi basati su Gemini 2.0.

Inoltre, il modello Gemini Robotics-ER è attualmente disponibile per un gruppo selezionato di “trusted tester“, tra cui Agile Robots, Agility Robots, Boston Dynamics ed Enchanted Tools. Queste collaborazioni strategiche permetteranno di testare le capacità dei modelli in una varietà di contesti reali e di raccogliere feedback preziosi per il loro sviluppo futuro.

Parallelamente allo sviluppo tecnologico, Google DeepMind sta dedicando una particolare attenzione agli aspetti etici e di sicurezza legati all’intelligenza artificiale e alla robotica. In questo contesto, l’azienda ha rilasciato un nuovo dataset, denominato ASIMOV, con l’obiettivo di valutare e migliorare la sicurezza semantica nei sistemi robotici.

Questo dataset è ispirato alle Tre Leggi della Robotica formulate da Isaac Asimov, concetti fondamentali che mirano a guidare il comportamento dei robot in modo da prevenire danni agli esseri umani.

Libero Shopping