L’agent opérateur d’OpenAI reçoit un sérieux coup de boost grâce à un nouveau modèle d’IA

OpenAI frappe encore fort. Son agent opérateur vient d’être superchargé par une mise à jour majeure de son modèle d’IA—parce que visiblement, le reste de l’écosystème tech n’avait pas assez de retard à rattraper.
Les détails techniques restent flous, comme d’habitude dans ce secteur qui adore les annonces tape-à-l’œil. Mais une chose est sûre : les actionnaires vont pouvoir se frotter les mains en anticipant une nouvelle hausse... avant le prochain krach des IA, bien sûr.
OpenAI remplace le modèle basé sur GPT-4O par une version basée sur O3
Openai Insignes lors d’une grande mise à niveau pour l’agent opérateur de chatppt pic.twitter.com/igpqp9butd
- Sabatage (@sabatage) 22 mai 2025
OpenAI a remplacé le modèle existant basé sur GPT - 4O pour l’opérateur par une version basée sur OpenAI O3, bien que la version API restera basée sur 4O. La société d’IA a également affirmé que l’opérateur O3 utilise la même approche de sécurité multicouche utilisée pour la version 4O.
Cependant, par rapport à d’autres modèles de la famille O3, l’opérateur O3 a été affiné avec des données de sécurité supplémentaires pour une utilisation par ordinateur, y compris des ensembles de données de sécurité conçus pour enseigner les limites de décision du modèle sur les confirmations et les refus.
OpenAI a publié un rapport technique montrant les performances de l’opérateur O3 sur des évaluations de sécurité spécifiques. Par rapport au modèle de l’opérateur GPT-4O, l’opérateur O3 était moins susceptible de refuser d’effectuer des activités «illicites» et de rechercher des données personnelles sensibles et moins sensible à une forme d’attaque d’IA appelée «injection rapide».
«L’opérateur O3 utilise la même approche multicouche de la sécurité que nous avons utilisée pour la version 4O de l’opérateur… Bien que l’opérateur O3 hérite des capacités de codage d’O3, il n’a pas accès natif à un environnement de codage ou à un terminal.»
–OpenAI
La société d’IA a également révélé que le nouveau modèle basé sur l’O3 passait par des évaluations de sécurité standard, et l’opérateur a continué à être disponible en tant que prévisualisation de recherche pour les utilisateurs de ChatGpt Pro dans le monde. Cependant, ce modèle mis à niveau n’était disponible que dans l’opérateur de Chatgpt.
Knoop soupçonne que le modèle O3 d’Openai pourrait être plus coûteux que prévu
La semaine dernière, l’Arc Prize Foundation, qui maintient et administre ARC-AGI, a mis à jour ses coûts informatiques approximatifs pour O3. L’organisation estimait à l’origine que la configuration la plus performante de l’O3 a testé, O3 High, a coûté environ 3 000 $ pour résoudre un seul problème d’arc-AGI. Cependant, la fondation estime désormais que le coût pourrait être 10 fois plus élevé que précédemment estimé, peut-être environ 30 000 $ par tâche.
De plus, alors qu’Openai n’a pas encore évalué O3 ou le libérer pleinement, l’un des co-fondateurs de l’Arc Prize Foundation, Mike Knoop, estime que le prix du modèle O1-Pro est un indicateur raisonnable et une comparaison plus étroite du véritable coût de l’O3. Il a toutefois ajouté que O3 continuerait à être étiqueté comme un aperçu du classement pour refléter l’incertitude jusqu’à l’annonce des prix officiels.
Selon l’ARC Prize Foundation, un prix élevé pour O3 High ne serait pas hors de question, étant donné le montant des ressources informatiques que le modèle aurait utilisé. O3 U3 Utilisé 172x plus informatique plus que O3 Low, la configuration la plus faible de l’O3, pour lutter contre l’arc-AGI.
Des rumeurs volent depuis début mars sur les plans coûteux Openai envisageaient de présenter des clients d’entreprise . Les informations ont indiqué que la société pourrait facturer jusqu’à 20 000 $ par mois pour les «agents» d’IA spécialisés, comme les agents de développeur de logiciels.
Cependant, alors que certains ont fait valoir que même les modèles les plus chers d’Openai coûteraient bien dans le cadre de ce qu’un extracpour humain ou un membre du personnel typique, le chercheur de l’IA, Toby Ord, a souligné que les modèles peuvent ne pas être aussi efficaces. Par exemple, O3 High avait besoin de 1 024 tentatives à chaque tâche d’Arc-Agi pour obtenir son meilleur score.
Cryptopolitan Academy: à venir bientôt - une nouvelle façon de gagner un revenu passif avec DeFi en 2025. En savoir plus