Amazon lanza el chip Trainium3: Un salto estratégico en la carrera por el hardware de IA

Amazon acaba de poner otra ficha sobre la mesa. No es un servicio en la nube más, ni una suscripción Prime. Es el Trainium3, un chip diseñado específicamente para entrenar modelos de inteligencia artificial. Y con él, la compañía no solo compite—intenta redefinir las reglas del juego.
La apuesta por el silicio propio
El gigante del comercio electrónico lleva años tejiendo su red de infraestructura. AWS es su columna vertebral. Ahora, con el Trainium3, busca independizarse de los proveedores tradicionales de chips, como Nvidia. El objetivo es claro: ofrecer a sus clientes una ruta más eficiente y, presumiblemente, más económica para entrenar sus modelos de IA a gran escala. No es solo un producto; es una declaración de soberanía tecnológica.
¿Por qué importa esto ahora?
El mercado de la IA está hambriento de potencia de cálculo. Cada nuevo modelo, más complejo que el anterior, devora recursos. Los costes se disparan. Amazon ve en este cuello de botella una oportunidad de negocio monumental. Al optimizar el hardware para las cargas de trabajo específicas del entrenamiento de IA, promete reducir tiempos y facturas de energía. En un mundo obsesionado con la escalabilidad, la eficiencia es la nueva moneda.
Un movimiento calculado en un tablero global
Este lanzamiento no ocurre en el vacío. Es un movimiento directo en la guerra fría tecnológica por la supremacía en IA. Mientras otras grandes tecnológicas también desarrollan chips especializados, Amazon juega con la ventaja de integrar verticalmente su hardware con su dominante plataforma en la nube. Una jugada que podría consolidar su ecosistema y hacerlo más sticky para los desarrolladores.
El cierre: eficiencia sobre euforia
El Trainium3 no es el chip que capturará titulares por su velocidad bruta en un benchmark aislado. Su promesa es menos glamurosa pero más potente: hacer que el entrenamiento de IA masivo sea sostenible y accesible. En una industria a menudo impulsada por el hype, Amazon apuesta por la utilidad fría y calculada. Porque al final, en la carrera de la IA, ganará quien pueda entrenar más inteligencia, más rápido y, sobre todo, más barato—un recordatorio pragmático de que incluso las revoluciones más disruptivas terminan sometidas a la tiranía de los márgenes de beneficio.
Amazon impulsa Trainium3 a escala de la nube
Trainium3 llega aproximadamente un año después de que Amazon lanzara su última versión. Ese ritmo se sitúa entre los más rápidos dentro de los estándares de chips. Cuando el chip se puso en marcha por primera vez en agosto, un ingeniero de AWS bromeó: «Lo principal que esperamos es que no veamos ningún problema». El rápido ritmo de actualización también refleja el plan público de Nvidia de lanzar un nuevo chip cada año.
Amazon afirma que los chips Trainium ejecutan el procesamiento pesado de los modelos de IA a un menor coste y un mejor consumo de energía que las GPU de gama alta de Nvidia. Dave afirmó: «Estamos muy satisfechos con nuestra capacidad para obtener la relación calidad-precio adecuada con Trainium». La compañía está apostando fuertemente por ese factor de precio a medida que aumenta el tamaño de los modelos y los costes de formación siguen aumentando.
Todavía hay un límite. Los chips de Amazon no incorporan las bibliotecas de software avanzadas que permiten a los equipos trabajar con rapidez en el hardware de Nvidia. Bedrock Robotics, que utiliza IA para controlar equipos de construcción sin control humano, ejecuta sus sistemas principales en servidores de AWS. Cuando entrena modelos para guiar una excavadora, sigue utilizando chips de Nvidia. Kevin Peterson, director de tecnología de Bedrock Robotics, afirmó: «Necesitamos que sea eficiente y fácil de usar. Eso es Nvidia».
Actualmente, la mayor parte de la capacidad de Trainium se destina a Anthropic. Los chips se ejecutan en centros de datos de Indiana, Misisipi y Pensilvania. A principios de este año, AWS anunció que había conectado más de 500.000 chips de Trainium para entrenar los modelos más recientes de Anthropic. Amazon planea aumentar esa cifra a un millón de chips para finales de año.
Amazon está vinculando el futuro de Trainium al crecimiento de Anthropic y a sus propios servicios de IA. Fuera de Anthropic, la compañía ha identificado muy pocos clientes importantes hasta el momento. Esto deja a los analistas con datos limitados para evaluar el rendimiento de Trainium en un uso más amplio.
Anthropic también distribuye su propio riesgo computacional. Sigue utilizando las Unidades de Procesamiento Tensorial de Google y firmó un acuerdo este año con Google que le proporciona acceso a decenas de miles de millones de dólares en potencia computacional.
Amazon presentó Trainium3 durante re: Invent, su conferencia anual de usuarios. El evento se ha convertido en una exhibición continua de herramientas e infraestructura de IA dirigida a desarrolladores que crean nuevos modelos y empresas dispuestas a pagar por acceso a gran escala.
Amazon lanza actualizaciones de Nova y abre Nova Forge
El martes, Amazon también actualizó su principal familia de modelos de IA, conocida como Nova. La nueva línea Nova 2 incluye una versión llamada Omni.
Omni acepta texto, imágenes, voz o video como entrada. Puede responder tanto con texto como con imágenes. Amazon vende una combinación de tipos de entrada y modelos de bajo costo en un paquete diseñado para uso diario a gran escala.
Amazon sigue fijando el precio de sus modelos en función de su rendimiento por dólar. Los modelos Nova anteriores no se situaron entre los primeros puestos en las clasificaciones de pruebas estándar que evalúan las respuestas a preguntas fijas. La compañía se basa en el uso en vivo en lugar de las tablas de pruebas.
Rohit Prasad, quien dirige gran parte del trabajo de modelos de Amazon y su equipo de Inteligencia Artificial General, dijo: "El verdadero punto de referencia es el mundo real", y agregó que espera que los nuevos modelos compitan en entornos reales.
Amazon también está abriendo un control más profundo de modelos para usuarios avanzados a través de un nuevo producto llamado Nova Forge que permite a los equipos extraer versiones de los modelos Nova antes de que finalice el entrenamiento y darles forma utilizando sus propios datos.
Reddit ya utiliza Nova Forge para crear un modelo que comprueba si una publicación infringe las normas de seguridad. Chris Slowe, director de tecnología de Reddit, afirmó que muchos usuarios de IA buscan el modelo más grande posible para cada tarea en lugar de entrenar uno con un enfoque específico. «El hecho de que podamos convertirlo en un experto en nuestra área específica es lo que le da valor», afirmó.
Con Trainium3 ya activo en centros de datos y la actualización simultánea de los modelos Nova, Amazon está impulsando dos frentes a la vez. La lucha por el hardware se libra contra Nvidia. El impulso del modelo se dirige contra OpenAI, respaldado por Microsoft, y Google. La siguiente fase se centra ahora en el uso práctico del cliente a escala completa de la nube.
No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis .