Amazon desvenda o Trainium3: o chip que acelera sua corrida pelo domínio do hardware de IA

A Amazon acaba de colocar mais uma peça no tabuleiro da guerra pela inteligência artificial. O lançamento do chip Trainium3 marca um salto agressivo na estratégia da gigante de tecnologia para construir sua própria infraestrutura de ponta—e reduzir sua dependência de terceiros.
Por que isso importa
Treinar modelos de IA de última geração consome quantidades absurdas de poder computacional e dinheiro. Desenvolver chips próprios, como o Trainium3, não é apenas uma questão de desempenho; é uma manobra para controlar custos, a cadeia de suprimentos e, por fim, o próprio ritmo da inovação. A Amazon não quer apenas alugar a nuvem—quer fabricar os motores que a fazem voar.
O que muda no jogo
A nova geração promete eficiência radical para o treinamento de modelos massivos, o tipo que alimenta desde assistentes generativos até sistemas de previsão complexos. Para desenvolvedores e empresas que rodam suas cargas de trabalho na AWS, isso pode significar projetos concluídos em menos tempo e com uma fatura menor. É um movimento claro para trancar os clientes em um ecossistema de hardware e software totalmente integrado.
O subtexto financeiro
Enquanto os analistas celebram cada anúncio de IA com projeções de receita futura, a realidade nos balanços trimestrais ainda é de investimentos maciços que queimam caixa. O Trainium3 é outro capítulo caríssimo nessa saga—uma aposta de bilhões para, quem sabe um dia, colher lucros de trilhões. Até lá, os acionistas continuam pagando pela fé no amanhã.
O veredito final: a Amazon está construindo o campo de jogo do zero. E, com o Trainium3, deixa claro que quem quiser jogar no futuro da IA terá que fazer pelas suas regras—ou pagar o preço para usar o seu equipamento.
A Amazon impulsiona o Trainium3 em escala de nuvem.
O Trainium3 chega cerca de um ano depois da Amazon ter lançado a sua última versão. Esse ritmo está entre os mais rápidos para padrões de chips. Quando o chip foi ligado pela primeira vez em agosto, um engenheiro da AWS brincou: "O principal que esperamos é que não vejamos nenhum tipo de fumaça ou fogo". O ritmo acelerado de atualizações também reflete o plano público da Nvidia de lançar um novo chip a cada ano.
A Amazon afirma que os chips Trainium executam o processamento computacional pesado por trás dos modelos de IA a um custo menor e com melhor consumo de energia do que as GPUs de ponta da Nvidia. Dave disse: "Estamos muito satisfeitos com nossa capacidade de obter o melhor custo-benefício com o Trainium". A empresa está apostando fortemente nesse aspecto do preço, à medida que o tamanho dos modelos aumenta e os custos de treinamento continuam subindo.
Ainda existe um limite. Os chips da Amazon não possuem as bibliotecas de software robustas que permitem às equipes trabalhar com rapidez em hardware da Nvidia. A Bedrock Robotics, que usa IA para operar equipamentos de construção sem controle humano, executa seus principais sistemas em servidores da AWS. Quando treina modelos para guiar uma escavadeira, ainda utiliza chips da Nvidia. Kevin Peterson, diretor de tecnologia da Bedrock Robotics, afirmou: “Precisamos que seja eficiente e fácil de usar. E a Nvidia oferece isso.”
Atualmente, a maior parte da capacidade do Trainium é direcionada para a Anthropic. Os chips são executados em data centers em Indiana, Mississippi e Pensilvânia. No início deste ano, a AWS afirmou ter conectado mais de 500.000 chips Trainium para treinar os modelos mais recentes da Anthropic. A Amazon planeja aumentar esse número para 1 milhão de chips até o final do ano.
A Amazon está vinculando o futuro do Trainium ao crescimento da Anthropic e aos seus próprios serviços de IA. Além da Anthropic, a empresa divulgou até agora poucos grandes clientes. Isso deixa os analistas com dados limitados para avaliar o desempenho do Trainium em um uso mais amplo.
A Anthropic também dilui seu próprio risco computacional. Ela ainda utiliza as Unidades de Processamento Tensorial (TPUs) do Google e firmou um acordo este ano com o Google que lhe dá acesso a dezenas de bilhões de dólares em poder computacional.
A Amazon apresentou o Trainium3 durante o re:Invent, sua conferência anual de usuários. O evento se transformou em uma demonstração contínua de ferramentas e infraestrutura de IA voltadas para desenvolvedores que criam novos modelos e empresas dispostas a pagar por acesso em larga escala.
A Amazon lança atualizações do Nova e inaugura o Nova Forge.
Na terça-feira, a Amazon também atualizou sua principal família de modelos de IA, conhecida como Nova. A nova linha Nova 2 inclui uma versão chamada Omni.
O Omni aceita texto, imagens, voz ou vídeo como entrada. Ele pode responder com texto e imagens. A Amazon está vendendo uma combinação de tipos de entrada e custos de modelo como um pacote projetado para uso diário em larga escala.
A Amazon continua a precificar seus modelos com base no desempenho por dólar. Os modelos Nova anteriores não ficaram entre os primeiros colocados em rankings de testes padrão que avaliam respostas a perguntas predefinidas. A empresa está priorizando o uso real em vez de gráficos de teste.
Rohit Prasad, que lidera grande parte do trabalho de modelagem da Amazon e sua equipe de Inteligência Artificial Geral, disse: "O verdadeiro parâmetro é o mundo real", e acrescentou que espera que os novos modelos sejam competitivos em situações reais.
A Amazon também está disponibilizando um controle mais aprofundado dos modelos para usuários avançados por meio de um novo produto chamado Nova Forge, que permite que as equipes extraiam versões dos modelos Nova antes do término do treinamento e as moldem usando seus próprios dados.
O Reddit já utiliza o Nova Forge para construir um modelo que verifica se uma publicação viola as regras de segurança. Chris Slowe, diretor de tecnologia do Reddit, afirmou que muitos usuários de IA optam pelo modelo mais abrangente possível para cada tarefa, em vez de treinar um modelo com foco específico. "O valor reside na possibilidade de torná-lo um especialista em nossa área específica", explicou.
Com o Trainium3 agora ativo em data centers e os modelos Nova atualizados simultaneamente, a Amazon está avançando em duas frentes ao mesmo tempo. A disputa de hardware se dá contra a Nvidia. O avanço dos modelos compete com a OpenAI, apoiada pela Microsoft, e o Google. A próxima fase agora se concentra no uso prático pelos clientes em escala total de nuvem.
Reivindique seu lugar gratuito em uma comunidade exclusiva de negociação de criptomoedas - limitada a 1.000 membros.