Nvidia amplia acesso da SchedMD a novos sistemas e acelera seu desenvolvimento

A Nvidia está abrindo as portas da próxima geração de hardware para a SchedMD, e o setor de HPC nunca mais será o mesmo.
A parceria estratégica entre o gigante das GPUs e a empresa por trás do Slurm — o sistema de gerenciamento de jobs que domina supercomputação — não é apenas um upgrade técnico. É uma reconfiguração do poder computacional.
Mais do que um simples acesso
A SchedMD agora tem acesso privilegiado a arquiteturas emergentes da Nvidia antes do lançamento geral. Isso permite que a empresa otimize o Slurm para explorar cada ciclo de clock, cada núcleo de streaming, cada novo caminho de memória. O desenvolvimento do software de agendamento não está apenas sendo 'impulsionado'; está sendo reescrito em tempo real para um futuro de exaflops.
O impacto em cascata
Pense nas implicações: laboratórios de pesquisa, instituições financeiras rodando simulações complexas e, claro, operações de mineração de criptomoedas em grande escala que dependem de eficiência extrema. Um agendador mais inteligente e integrado significa menos tempo ocioso do hardware caríssimo. Traduzindo: mais resultados por watt, mais lucro por investimento.
O jab cínico das finanças
Enquanto os traders de Wall Street ainda discutem se 'IA' é um modismo, a Nvidia simplesmente está construindo a estrada sobre a qual todo o tráfego — incluindo o deles — vai passar. E, como sempre, cobra o pedágio.
O resultado final? A infraestrutura invisível que orquestra a computação de ponta acaba de receber um turbo. E para quem está no jogo da performance bruta, isso vale mais do que qualquer previsão otimista de analista.
A Nvidia aumentará o acesso da SchedMD a novos sistemas e impulsionará seu desenvolvimento.
A Nvidia está aumentando seus investimentos em ferramentas de código aberto como parte de uma estratégia mais ampla para se manter à frente no mercado de inteligência artificial, que cresce rapidamente. A empresa trabalha em estreita colaboração com a SchedMD há mais de dez anos e, agora, com a aquisição, continuará investindo na Slurm.
O Slurm, que significa "Utilitário Linux Simples para Gerenciamento de Recursos", é há muito tempo uma parte essencial da supercomputação. Atualmente, ele é usado em mais da metade dos 500 supercomputadores mais poderosos do mundo, permitindo o agendamento de cálculos paralelos complexos. Ele também permite a alocação de recursos entre milhares de CPUs e GPUs.
Ao integrar o SchedMD, a NVIDIA assume o controle dessa peça crucial da pilha de software de HPC e IA, conectando a aceleração de hardware (por meio das GPUs Blackwell da NVIDIA e da rede InfiniBand) ao sofisticado agendamento de tarefas e orquestração de recursos. Essa integração aprimorará o desempenho em tudo, desde o treinamento de grandes modelos de linguagem até a execução de simulações científicas de missão crítica.
Danny Auble, CEO da SchedMD, comentou sobre a aquisição: "Estamos muito felizes em unir forças com a NVIDIA, pois essa aquisição é a validação definitiva do papel crucial do Slurm nos ambientes de HPC e IA mais exigentes do mundo. A vasta experiência e o investimento da NVIDIA em computação acelerada aprimorarão o desenvolvimento do Slurm — que continuará sendo de código aberto — para atender às demandas da próxima geração de IA e supercomputação."
A Nvidia também afirmou: "O Slurm, que é compatível com o hardware mais recente da Nvidia, também faz parte da infraestrutura crítica necessária para IA generativa, sendo usado por desenvolvedores de modelos básicos e construtores de IA para gerenciar as necessidades de treinamento e inferência de modelos."
A fabricante de chips de IA certamente expandirá o alcance do SchedMD para novos sistemas, permitindo que os clientes gerenciem cargas de trabalho com mais eficiência em toda a sua infraestrutura. Além disso, a integração permitirá que os clientes coordenem melhor as cargas de trabalho em diferentes tipos de hardware e software, beneficiando-se das inovações contínuas do Slurm.
A empresa também planeja continuar oferecendo suporte ao Slurm com serviços de software de código aberto e treinamento para a ampla base de clientes da SchedMD, que abrange organizações de nuvem, IA, manufatura e pesquisa.
A Nvidia anunciou novos modelos Nano no início desta semana.
Na segunda-feira, a Nvidia apresentou uma nova geração de modelos de IA de código aberto, projetados para serem mais rápidos, eficientes e capazes do que seus antecessores, em resposta a um aumento de lançamentos semelhantes vindos da China. A empresa revelou seus mais recentes modelos Nemotron para casos de uso como escrita e desenvolvimento de software, começando com o lançamento do Nemotron 3 Nano. De acordo com a fabricante de chips, o novo modelo Nano reduz custos e, ao mesmo tempo, melhora a precisão em cargas de trabalho mais longas e exigentes.
Enquanto isso, a Meta estaria considerando uma mudança para modelos de código fechado, o que potencialmente tornaria a Nvidia uma das principais fornecedoras de IA de código aberto dos EUA. Até o momento, diversos estados e agências governamentais dos EUA proibiram sistemas de IA chineses devido a preocupações com a segurança. A maioria dessas entidades alegou que os modelos chineses estão sendo usados em operações militares e de inteligência do país asiático.
No entanto, Kari Briski, vice-dent de IA Generativa da Nvidia, enfatizou que a empresa visa fornecer aos usuários um modelo confiável e está disponibilizando dados de treinamento e ferramentas para testes de segurança e personalização. Briski observou: "É por isso que estamos comprometidos com isso do ponto de vista da engenharia de software."
As ações da empresa chegaram a subir 1,35% após o anúncio de seus modelos de IA de código aberto.
Se você está lendo isso, já está na frente. Acompanhe nossa newsletter .