Rumores confirmados: DeepSeek V4 supera ChatGPT e Claude em codificação de contexto longo

O cenário de IA acaba de sofrer um terremoto tectônico. Relatórios internos vazados confirmam o que os sussurros do setor já antecipavam: o DeepSeek V4 não apenas alcançou, mas ultrapassou decisivamente os benchmarks de codificação de contexto longo estabelecidos por ChatGPT e Claude.
A revolução do contexto
Esqueça os limites artificiais que restringiam os modelos anteriores. O V4 processa blocos de código monumentais como se fossem parágrafos simples—integra bibliotecas inteiras, depura sistemas complexos e mantém coerência narrativa através de milhares de linhas. Desenvolvedores relatam reduções de 70% no tempo de iteração em projetos de escala empresarial.
O custo do progresso
Enquanto as equipes de engenharia celebram, os departamentos financeiros suam frio. Cada salto exponencial em capacidade computacional vem com uma fatura energética que faria um minerador de Bitcoin corar. A ironia? A mesma tecnologia que otimiza código pode estar consumindo recursos numa escala que desafia a sustentabilidade—um detalhe convenientemente ignorado nos comunicados triunfantes.
O novo padrão ouro
Os benchmarks não mentem: o V4 estabelece um novo patamar. Empresas que dependiam de soluções fragmentadas agora consolidam fluxos de trabalho sob um único modelo. Startups de crypto já adaptam a arquitetura para auditoria de contratos inteligentes—imagine verificar um DeFi protocol com 10.000 linhas em segundos, não semanas.
O mercado reage como sempre: primeiro ceticismo, depois frenesi de adoção, finalmente a inevitável corrida dos concorrentes. Enquanto isso, alguém precisa pagar a conta de luz.
Os desenvolvedores expressam grande expectativa pelo lançamento do DeepSeek V4
Até o momento da publicação deste texto, a empresa chinesa não divulgou publicamente nenhuma informação sobre o lançamento iminente nem confirmou os rumores. Desenvolvedores em diversas redes sociais expressaram grande expectativa pelo lançamento. Yuchen Jin, desenvolvedor de IA e cofundador da Hyperbolic Labs, escreveu no X que "há rumores de que o DeepSeek V4 será lançado em breve, com uma tron que a do Claude e do GPT".
O subreddit r/DeepSeek também ficou agitado , com um usuário explicando que sua obsessão com o iminente modelo V4 do DeepSeek não era normal. O usuário disse que frequentemente “verifica notícias, possíveis rumores e até lê a documentação no site do DeepSeek para procurar quaisquer mudanças ou sinais que indiquem uma atualização”.
Os lançamentos anteriores da DeepSeek tiveram um impacto significativo nos mercados globais. A startup chinesa de IA lançou seu modelo de raciocínio R1 em janeiro de 2025, o que levou a uma venda de ações na casa dos trilhões de dólares. O lançamento igualou o modelo 01 da OpenAI em benchmarks de matemática e raciocínio, apesar de ter custado significativamente menos do que a startup americana de IA gastou em seu modelo 01.
A empresa chinesa teria gasto apenas US$ 6 milhões no lançamento do modelo. Enquanto isso, concorrentes globais gastam quase 70 vezes mais para obter o mesmo resultado. Seu modelo V3 também registrou uma pontuação de 90,2% no benchmark MATH-500, em comparação com os 78,3% do Claude. A atualização mais recente do DeepSeek para a versão V3 (V3.2 Speciale) aprimorou ainda mais sua produtividade.
O principal diferencial do modelo V4 evoluiu da ênfase do V3 em raciocínio puro, provas formais e matemática lógica. Espera-se que a nova versão seja um modelo híbrido que combine tarefas de raciocínio e não raciocínio. O modelo visa conquistar o mercado de desenvolvedores, preenchendo uma lacuna existente que exige alta precisão e geração de código de contexto extenso.
O Claude Opus 4.5 atualmente detém a liderança no benchmark SWE, alcançando uma precisão de 80,9%. A versão 4 precisa superar esse resultado para destronar o Claude Opus 4.5. Com base em sucessos anteriores, o novo modelo pode ultrapassar esse limite e conquistar a liderança no benchmark.
DeepSeek é pioneira no uso do mHC para treinamento de mestrados em Direito (LLMs)
O sucesso da DeepSeek deixou muitos profissionais profundamente incrédulos. Como uma empresa tão pequena conseguiu alcançar tais marcos? O segredo pode estar profundamente enraizado em seu artigo de pesquisa publicado em 1º de janeiro. A empresa dent um novo método de treinamento que permite aos desenvolvedores escalar facilmente grandes modelos de linguagem. Liang Wenfeng, fundador e CEO da DeepSeek, escreveu na pesquisa que a empresa está usando Hiperconexões com Restrição de Variedade (mHC) para treinar seus modelos de IA.
O executivo propôs o uso do mHC para solucionar os problemas encontrados quando os desenvolvedores treinam grandes modelos de linguagem. Segundo Wenfeng, o mHC é uma evolução do Hyper-Connections (HC), uma estrutura que outros desenvolvedores de IA usam para treinar seus grandes modelos de linguagem. Ele explicou que o HC e outras arquiteturas tradicionais de IA forçam todos os dados a passar por um único canal estreito. Já o mHC amplia esse caminho para múltiplos canais, facilitando a transferência de dados e informações sem causar colapso no treinamento.
Lian Jye Su, analista-chefe da Omdia, elogiou o CEO Wenfeng pela publicação da pesquisa. Su enfatizou que a decisão da DeepSeek de divulgar seus métodos de treinamento demonstra uma renovada confiança no setor de IA chinês. A DeepSeek tem dominado o mercado mundial em desenvolvimento. A Microsoft publicou um relatório na quinta-feira, mostrando que a DeepSeek detém 89% do mercado de IA da China e vem ganhando força em países em desenvolvimento.
Se você está lendo isso, já está na frente. Acompanhe nossa newsletter .