🟥 "Scopri Gemini Robotics On-Device: La Rivoluzione di Google nella Robotica con Visione-Linguaggio-Azione"

Giorno: 26 giugno 2025 | Ora : 11:53 Il 26 giugno, Google ha lanciato il Gemini Robotics On-Device, un modello VLA per robot a braccia doppie, progettato per ridurre il consumo di risorse. Funziona offline, ideale per applicazioni sensibili ai ritardi. Dimostra capacità avanzate in visione e manovra, comprendendo comandi in linguaggio naturale e adattandosi facilmente a nuovi compiti. È personalizzabile dagli sviluppatori e testato su robot fisici, eseguendo compiti complessi con precisione.
Introduzione al Gemini Robotics On-Device
Il 26 giugno, Google ha annunciato il lancio del suo modello di visione-linguaggio-azione (VLA) più potente, il Gemini Robotics On-Device. Questo modello è progettato come una base universale per robot a braccia doppie e mira a ridurre il consumo di risorse computazionali.
Capacità di Operazione e Adattamento
Il Gemini Robotics On-Device offre abilità generali di manovra e capacità di generalizzazione dei compiti, consentendo esperimenti rapidi su compiti di precisione e adattandosi a nuove sfide attraverso il fine-tuning per migliorare le prestazioni.
Funzionamento Offline e Applicazioni Sensibili al Ritardo
Un aspetto cruciale di questo modello è la sua capacità di funzionare completamente offline sui dispositivi robotici. Google sottolinea che, non essendo dipendente da una rete dati durante l'operazione, il modello è ideale per applicazioni sensibili ai ritardi e può operare in ambienti con connessione instabile o assente, permettendo ai robot di “vedere, ascoltare e agire” anche senza internet.
Competenze Avanzate di Comprensione e Manovra
Il Gemini Robotics On-Device ha dimostrato notevoli capacità di visione, semantica e generalizzazione comportamentale in vari scenari di test, riuscendo a comprendere comandi in linguaggio naturale e a svolgere compiti complessi come aprire cerniere e piegare vestiti.
Micro-adattamento e Personalizzazione
Un'altra caratteristica distintiva del Gemini Robotics On-Device è la sua capacità di micro-adattamento. Questo modello è il primo VLA di Google reso disponibile per l'adattamento esterno, consentendo agli sviluppatori di personalizzarlo per migliorare le prestazioni in contesti specifici, mostrando buone capacità di generalizzazione con soli 50-100 campioni dimostrativi.
Test e Applicazioni su Robot Fisici
Google ha testato il modello su sette compiti di manovra di difficoltà variabile, come chiudere cerniere di contenitori e versare condimenti. Inoltre, il modello è stato adattato a robot fisici diversi, come il robot a braccia Franka FR3 e il robot umanoide Apollo, eseguendo istruzioni generali e compiti di precisione industriale.