Gemini domine la robotique sur-appareils : une avance écrasante sur les autres modèles de Google
La course à l'IA embarquée vient de trouver son champion. Gemini écrase la concurrence maison de Google avec une performance robotique inédite sur appareils mobiles.
Sous le capot : une optimisation radicale qui laisse les autres modèles dans la poussière. Les ingénieurs ont visiblement trouvé la formule magique entre compression algorithmique et puissance brute.
Résultat ? Des temps de réponse qui pulvérisent les benchmarks internes - de quoi faire rougir les actionnaires habitués aux promesses vaporeuses du secteur. La vraie révolution ne viendra pas des data centers, mais bien de votre poche.
La robotique sur-périphérique surpasse les autres modèles de Google
Nous apportons une IA puissante directement sur des robots avec Gemini Robotics sur périphérique. 🤖
Il s'agit de notre premier modèle d'action visuelle pour rendre les robots plus rapides, très efficaces et adaptables à de nouvelles tâches et environnements - sans avoir besoin d'une connexion Internet constante. 🧵 pic.twitter.com/1y21d3cf5t
- Google Deepmind (@googleepmind) 24 juin 2025
Le responsable de la robotique chez Google Deepmind, Carolina Parada, a soutenu que le modèle original de robotique Gemini utilise une approche hybride, ce qui lui permet de fonctionner sur les appareils et sur le cloud. Elle a dit qu'avec le nouveau modèle de périphérique uniquement, les utilisateurs peuvent accéder aux fonctionnalités hors ligne presque ainsi qu'à celles du fleuron.
La société technologique affirme que le modèle fonctionne à un niveau proche du modèle robotique Gemini basé sur le cloud dans les références. Google a également déclaré que cela surpasse les autres modes sur l'appareil dans des références générales, bien qu'elle n'ait pas nommé ces modèles.
"Le modèle hybride Gemini Robotics est encore plus puissant, mais nous sommes en fait assez surpris de voir à queltronle modèle sur les appareils est en fait. J'y pense comme un modèle de démarrage ou comme un modèle d'applications qui ont une mauvaise connectivité."
-Carolina Parada, responsable de la robotique chez Google Deepmind.
L'entreprise illustrée dans les robots de démonstration exécutant le modèle local, dézipper les sacs et les vêtements pliants. Google a reconnu que même si le modèle était formé pour les robots Aloha, il l'a adapté plus tard pour travailler sur un robot Bi-Arm Franka FR3 et le robot humanoïde Apollo par l'applicationtronIk.
La société technologique affirme que le bi-bras Franka FR3 a réussi à aborder des scénarios et des objets qu'il n'avait jamais vus auparavant, comme faire de l'assemblage sur une ceinture industrielle. L'entreprise a mentionné que les développeurs peuvent montrer des robots 50 à 100 démonstrations de tâches pour les former sur de nouvelles tâches en utilisant les modèles sur le simulateur de physique Mujoco.
Google Deepmind a également mentionné la sortie d'un kit de développement logiciel appelé le SDK Gemini Robotics. La société a révélé que son SDK robotique fournit des outils de cycle de vie complet nécessaires à l'utilisation de modèles de robotique Gemini, y compris l'accès à des points de contrôle, le service d'un modèle, l'évaluation du modèle sur le robot et dans la carte SIM, le téléchargement des données et le régler. L'entreprise a révélé que son modèle de robotique Gemini à disposition et son SDK seront disponibles pour un groupe de testeurs de confiance tandis que Google continue de travailler à minimiser les risques de sécurité.
Les entreprises technologiques se joignent à la course robotique
D'autres sociétés qui utilisent des modèles d'IA montrent également l'intérêt pour la robotique. Nvidia construit une plate-forme pour créer des modèles fondamentaux pour les humanoïdes. Le PDG de l'entreprise, Jensen Huang, a noté que la construction de modèles de fondation pour les robots humanoïdes généraux est l'un des problèmes les plus excitants à résoudre dans l'IA aujourd'hui.
Huang a soutenu que le facteur humanoïde est l'un des sujets les plus contestés du monde de la robotique en ce moment. Il a reconnu que cela augmentait le capital-risque par la cargaison tout en générant un scepticisme massif en cours de route.
Nvidia a également défendu l'innovation robotique grâce à des initiatives comme Isaac et Jetson. L'année dernière en mars, lors de sa conférence annuelle sur les développeurs du GTC, la société a rejoint la course humanoïde avec Project Groot.
Nvidia a qualifié la nouvelle plate-forme comme un modèle de base à usage général pour les robots humanoïdes. L'entreprise a déclaré que Groot prendra également en charge le nouveau matériel de Nvidia.
Le visage étreint ne développe pas seulement des modèles ouverts et des ensembles de données pour la robotique, mais il fonctionne également sur les robots. L'entreprise a révélé plus tôt ce mois-ci un modèle OpenAI pour la robotique appelée Smolvla.
La société affirme que le modèle est formé sur des ensembles de données partagés par la communauté et surpasse les modèles beaucoup plus importants pour la robotique dans des environnements virtuels et réels. Hugging Face a également révélé que Smolvla vise à démocratiser l'accès aux modèles de vision-action (VLA) et à accélérer la recherche envers les agents robotiques généralistes.
L'année dernière, l'entreprise a lancé Lerobot, une collection de modèles, d'ensembles de données et d'outils axés sur la robotique. Plus récemment, Hugging Face a acquis des pollen Robotics, une startup de robotique basée en France, et a révélé plusieurs systèmes de robotique bon marché, y compris les humanoïdes, à l'achat.
Votre nouvelle crypto mérite l'attention - la différence clé vous place sur plus de 250 sites supérieurs