BTCC / BTCC Square / CryptopolitanFR /
Deepseek’s R1-0528 détrône presque l’O4-Mini d’OpenAI — la course à l’IA s’intensifie

Deepseek’s R1-0528 détrône presque l’O4-Mini d’OpenAI — la course à l’IA s’intensifie

Published:
2025-05-30 10:30:42
15
1

R1-0528 de Deepseek se classe désormais juste derrière O4-Mini d’Openai

Le modèle R1-0528 de Deepseek vient de grignoter la deuxième place du podium, talonnant de près l’O4-Mini d’OpenAI. Une avancée qui secoue le paysage des LLM — et les valorisations farfelues des startups en série B.

Les benchmarks parlent d’eux-mêmes : l’écart se resserre comme un spread de trading haute fréquence. Pendant ce temps, les VCs continuent de surfer sur la hype en ignorant allègrement le mot ’profitabilité’.

R1-0528 se classe désormais juste derrière O3 et O4-Mini d’Openai

Sur LivecodeBench, qui mesure les performances du modèle AI, R1-0528 se classe désormais juste derrière les modèles O4-Mini et O3 d’Openai.

"La dernière mise à niveau de Deepseek est plus nette sur le raisonnement,tronGer sur les mathématiques et le code, et la clôture sur des modèles de haut niveau comme Gemini et O3", a déclaré Adina Yakefu, chercheuse d’IA à Hugging Face.

Elle a ajouté que la nouvelle version montre «des améliorations majeures de l’inférence et de la réduction des hallucinations» et prouve que la start-up ne se fait pas simplement en rattraper mais en concurrence activement.

Les progrès rapides sont survenus après que Washington avait limité les puces avancées et autres exportations technologiques vers la Chine. Pourtant, les entreprises chinoises continuent d’affiner leurs systèmes. Plus tôt ce mois-ci, Baidu et Tencent ont décrit les façons dont ils font fonctionner leurs modèles plus efficacement malgré un accès limité aux semi-conducteurs de pointe.

Le directeur général de Nvidia, Jensen Huang, a critiqué mercredi les contrôles des exportations. "Les États-Unis ont basé sa politique sur l’hypothèse que la Chine ne peut pas faire de puces d’IA", a-t-il déclaré. «Cette hypothèse a toujours été discutable, et maintenant c’est clairement faux. La question n’est pas de savoir si la Chine aura une IA. C’est déjà le cas.»

Deepseek a augmenté les performances du modèle QWEN3 8B d’Alibaba de 10%

Deepseek a également déclaré avoir distillé les étapes de raisonnement utilisées dans R1-0528 dans QWEN3 8B d’Alibaba. Ce processus a créé un nouveau modèle plus petit qui a dépassé les performances de QWEN3 de plus de 10%, selon la société. Dans le même temps, le modèle était 30 fois plus petit.

"Nous pensons que la chaîne de réflexion à partir de Deepseek-R1-0528 aura une importance significative pour la recherche universitaire sur les modèles de raisonnement et les travaux industriels sur les petits modèles", a déclaré la firme.

Selon Reuters, un représentant Deepseek a déclaré à un groupe WeChat que le changement était une «mise à niveau de l’essai mineur» qui était déjà ouverte aux tests publics. En réponse à la concurrence féroce, Google a actualisé certains niveaux d’accès aux Gémeaux, tandis qu’Openai a introduit le modèle MINI O3 à moindre coût.

Cryptopolitan Academy: fatiguée des balançoires du marché? Découvrez comment DeFi peut vous aider à créer un revenu passif stable. Inscrivez-vous maintenant

|Square

Obtenez l'application BTCC pour commencer votre expérience avec les cryptomonnaies

Commencer aujourd'hui Scannez pour rejoindre nos + de 100 millions d’utilisateurs