BTCC / BTCC Square / CryptopolitanPT /
Deepseek R1-0528 chega perto de superar o O4-Mini da OpenAI em desempenho

Deepseek R1-0528 chega perto de superar o O4-Mini da OpenAI em desempenho

Published:
2025-05-30 10:30:42

O modelo R1-0528 da Deepseek está a um passo de ultrapassar o O4-Mini da OpenAI, segundo benchmarks recentes.

Rivalidade acirrada: A disputa por liderança em IA compacta esquenta enquanto startups desafiam gigantes.

E enquanto os modelos brigam por supremacia, os VCs já estão reciclando pitch decks para surfar a próxima onda de hype - porque inovação real é secundária quando se pode inflacionar valuations.

R1-0528 agora está logo atrás do OpenAi e O4-Mini do Openai

No LivecodeBench, que mede o desempenho do modelo de IA, o R1-0528 agora está logo atrás dos modelos O4-Mini e O3 do Openai.

"A última atualização da Deepseek é mais nítida sobre o raciocínio, otronGer sobre matemática e código e fechando modelos de primeira linha como Gemini e O3", disse Adina Yakefu, pesquisadora de IA da Hugging Face.

Ela acrescentou que a nova versão mostra "grandes melhorias na inferência e redução de alucinação" e prova que a start-up não está apenas alcançando, mas competindo ativamente.

O rápido progresso ocorreu depois que Washington restringiu chips avançados e outras exportações de tecnologia para a China. No entanto, as empresas chinesas continuam a refinar seus sistemas. No início deste mês, Baidu e Tencent descreveram maneiras pelas quais estão fazendo seus modelos funcionarem com mais eficiência, apesar do acesso limitado a semicondutores de ponta.

O executivo -chefe da Nvidia, Jensen Huang, criticou os controles de exportação na quarta -feira. "Os EUA basearam sua política na suposição de que a China não pode fazer chips de IA", disse ele. "Essa suposição sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Já faz."

Deepseek aumentou o desempenho do modelo QWEN3 8B do Alibaba em 10%

A Deepseek também disse que destilou as etapas de raciocínio usadas em R1-0528 no QWEN3 8B do Alibaba. Esse processo criou um modelo novo e menor que superou o desempenho da QWEN3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.

"Acreditamos que a cadeia de pensamentos da DeepSeek-R1-0528 terá uma importância significativa para pesquisas acadêmicas sobre modelos de raciocínio e trabalho industrial em pequenos modelos", afirmou a empresa.

Segundo a Reuters, um representante do Deepseek disse a um grupo do WeChat que a mudança era uma "atualização de julgamento menor" que já estava aberta para testes públicos. Em resposta à competição mais feroz, o Google desconsiderou algumas camadas de acesso de Gemini, enquanto o OpenAI introduziu o modelo O3 Mini de menor custo.

Academia Cryptopolitan: Cansado de balanços de mercado? Saiba como DeFi pode ajudá -lo a criar renda passiva constante. Registre -se agora

|Square

Baixe o aplicativo BTCC para iniciar sua jornada criptográfica

Comece hoje mesmo Escaneie e junte-se a nossos +100 M usuários