El modelo O3 de OpenAI no cumple con los estándares de rendimiento que prometía en sus declaraciones iniciales

Author:

Published:

2025-04-21 02:29:21

El modelo O3 de OpenAI no se encuentra en sus propias reclamaciones de referencia

Recientes evaluaciones independientes revelan que el modelo O3 de OpenAI, a pesar de sus ambiciosas afirmaciones iniciales, no alcanza los niveles de rendimiento prometidos en sus benchmarks de referencia. Expertos en inteligencia artificial señalan discrepancias significativas entre los resultados publicados por la compañía y los obtenidos en pruebas reales, lo que ha generado escepticismo en la comunidad tecnológica. Este desarrollo podría impactar la credibilidad de OpenAI en futuros lanzamientos y sus relaciones con inversores y socios comerciales.

Operai confirmó que el modelo Public O3 usa menos cómputo que la versión de demostración

La evidencia de que falta el O3 comercial también provino de las pruebas de la Fundación del Premio ARC, que probó una construcción anterior y más grande. El lanzamiento público "es un modelo diferente ... sintonizado para el uso de chat/producto", ARC Price Foundation publicó en X, y agregó que "todos los niveles de cómputo O3 lanzados son más pequeños que la versión que comparamos".

La empleada de Operai, Wenda Zhou, ofreció una explicación similar durante una transmisión en vivo la semana pasada. El sistema de producción, dijo, estaba "más optimizado para los casos de uso del mundo real" y la velocidad. "Hemos hecho [optimizaciones] para que el modelo sea más rentable [y] más útil en general", dijo Zhou, al tiempo que reconoce posibles "disparidades".

Dos modelos más pequeños de la compañía, O3 -Mini -Aligh y el recientemente anunciado O4 -Mini, ya vencieron a O3 en Frontiermath, y OpenAi dice que una mejor variante de O3 -Pro llegará en las próximas semanas.

Aún así, muestra cómo los titulares de referencia pueden ser engañosos. En enero, Epoch fue criticada por retrasar la divulgación de fondos de Operai hasta después del debut de O3. Más recientemente, la startup Xai de Elon Musk fue acusada de presentar cuadros que exageraban las capacidades de su modelo Grok 3.

Los observadores de la industria dicen que tales controversias de referencia se están convirtiendo en una ocurrencia en la industria de la IA a medida que las empresas corren para capturar los titulares con nuevos modelos.

Academia Cryptopolitan: ¿Cansado de columpios del mercado? Aprenda cómo DeFi puede ayudarlo a generar ingresos pasivos constantes. Registrarse ahora

Por:

Un nuevo token valorado en $0.025 busca competir con Cardano (ADA) y proyecta alcanzar los $10

El interés institucional en XRP continúa en alza durante fase de consolidación, mientras inversores de Standio anticipan preventa de Fase 4

|Square

Descárguese la aplicación BTCC para empezar su trayectoria cripto

Download on the App Store GEI IT ON Google Play

Empiece hoy mismo Escanéelo y únase a más de 100 millones de usuarios

Recomendado

Promociones

El modelo O3 de OpenAI no cumple con los estándares de rendimiento que prometía en sus declaraciones iniciales

Operai confirmó que el modelo Public O3 usa menos cómputo que la versión de demostración

|Square