Nvidia déploie de nouveaux modèles ouverts pour améliorer l’IA physique et numérique

Nvidia frappe encore. Le géant des puces déploie une nouvelle vague de modèles open-source, cette fois pour combler le fossé entre les mondes physique et numérique. Une manœuvre qui pourrait bien redéfinir les règles du jeu en matière d'intelligence artificielle.
Le cœur de la manœuvre
Ces modèles ne se contentent pas de traiter des données. Ils apprennent à simuler et à interagir avec des environnements réels. Pensez à des jumeaux numériques hyper-réalistes, à des robots qui s'adaptent en temps réel, ou à des systèmes de conception qui prédisent les contraintes physiques avant même qu'un prototype ne soit construit. Nvidia ne vend pas juste des GPU ; il vend désormais les briques de base de la réalité.
Les implications pour l'industrie
Pour les secteurs comme l'ingénierie, la logistique ou la recherche scientifique, l'impact est colossal. Les cycles de développement se raccourcissent. Les tests deviennent moins coûteux et plus sûrs. L'innovation, en théorie, s'accélère. Une aubaine pour les entreprises prêtes à plonger – et à payer la facture de calcul qui va avec.
La ligne de fond
Cette annonce renforce la position de Nvidia en tant que fournisseur d'infrastructure indispensable à l'ère de l'IA. Chaque avancée dans les modèles crée une demande plus forte pour sa puissance de traitement. Une stratégie brillante, presque cynique, qui transforme chaque innovation logicielle en un argument de vente matériel. Les investisseurs traditionnels, eux, continuent de chercher la « valeur fondamentale » pendant que Nvidia réécrit les fondamentaux de l'industrie.
Nvidia démontre un engagementtronfort envers l'open source
Le géant technologique a démontré un engagement plus marqué envers l'open source lors de cet événement dédié à l'IA, un effort salué par la plateforme d'évaluation comparative de l'IA, Artificial Analysis, grâce à son nouvel indice d'ouverture. Cet indice classe la tron parmi les meilleures du marché. Ce classement repose sur la quantité d'informations techniques partagées, la facilité d'utilisation des licences de modèles et la clarté des réglementations relatives à l'utilisation des données.
Parallèlement, AR1 (Alpamayo-R1) intègre un raisonnement IA par chaîne de pensée à la planification de trajectoire pour permettre une autonomie de niveau 4 et améliorer la sécurité des véhicules autonomes dans diverses situations routières. Le fabricant de puces a indiqué que les versions précédentes des modèles de conduite autonome rencontraient des difficultés face à des situations telles qu'un carrefour très fréquenté par les piétons, une voiture en double file sur une piste cyclable ou une route barrée à l'approche. En revanche, le raisonnement confère aux véhicules autonomes le bon sens nécessaire pour conduire comme des humains.
Le modèle AR1 y parvient en décomposant les scénarios et en raisonnant à chaque étape pour envisager tous les résultats possibles. Il utilise ensuite des données contextuelles pour déterminer la ligne de conduite la plus efficace.
Nvidia affirme que l'AR1 exploite un raisonnement séquentiel lui permettant de traiter les données tout au long de son parcours et d'utiliser ces informations pour planifier une trajectoire, par exemple en s'arrêtant pour laisser passer les piétons imprudents. Ce modèle, basé sur la plateforme cosmos Reason de la firme, est ouvert et permet aux chercheurs de le personnaliser pour leurs applications non commerciales.
D'après le fabricant de puces, les chercheurs peuvent également personnaliser le modèle AR1 pour l'évaluation comparative ou le développement d'applications expérimentales pour les véhicules autonomes. Nvidia Drive Alpamayo-R1 sera disponible sur Hugging Face et GitHub , tandis qu'un sous-ensemble des données utilisées pour l'entraînement et l'évaluation des modèles est accessible sur Nvidia Physical AI Open Datasets.
L'apprentissage par renforcement s'avère efficace pour le post-entraînement d'AR1.
Les chercheurs de Nvidia ont affirmé que l'entraînement par renforcement s'était révélé efficace pour le post-entraînement d'AR1. Ils ont souligné que les développeurs peuvent également apprendre à utiliser et à post-entraîner des modèles basés sur Cosmos grâce à un raisonnement étape par étape. Les chercheurs ont indiqué que des exemples d'inférence rapide et de post-entraînement avancé sont disponibles dans le Cosmos Cookbook . Ce guide complet, destiné aux développeurs d'IA physique, couvre la curation des données étape par étape, l'évaluation des modèles et la génération de données synthétiques.
Par ailleurs, le fabricant de puces a indiqué que les possibilités d'applications basées CosmosCosmossont quasi illimitées. Le géant technologique a cité en exemple LidarGen, Omniverse NuRec Fixer, Cosmos Policy et ProtoMotions3.
L'entreprise technologique s'est vantée que LidarGen était le premier modèle au monde à générer des données lidar pour les simulations de véhicules autonomes. Elle a également mentionné que son modèle Omniverse NuRec Fixer, destiné à la simulation de robotique et de véhicules autonomes, exploite la Cosmos Predict de Nvidia.
ProtoMotions3 est un framework open source, accéléré par GPU, basé sur les processeurs Nvidia Newton et Isaac Lab. Selon le fabricant de la puce, ce framework permet d'entraîner des robots humanoïdes et des humains numériques simulés physiquement. Les modèles de base du monde Cosmos (WFM) permettent de générer des scènes réalistes.
Nvidia a également indiqué que les modèles de politiques peuvent être entraînés dans Isaac SIM et Isaac Lab. Les données générées par ces modèles peuvent ensuite servir à l'entraînement ultérieur des Groot N destinés à la robotique.
Affinez votre stratégie grâce au mentorat et aux idées quotidiennes - Accès gratuit de 30 jours à notre programme de trading