Fujitsu oferece tecnologia de otimização de GPU que considera uma economia de servidor
A Fujitsu começou a vender middleware que otimiza o uso de GPUs, para que aqueles que têm a sorte de possuir os escassos aceleradores possam ter certeza de que serão sempre bem utilizados.
O software está disponível imediatamente, de acordo com uma terça-feira anúncioque revela que o sumô tecnológico japonês criou o alocador de GPU em novembro de 2023.
O software distingue entre programas que requerem uma GPU e aqueles que funcionam bem apenas com uma CPU e atribui o recurso apropriado.
Também pode alocar recursos em tempo real “para dar prioridade a processos com alta eficiência de execução, mesmo que a GPU esteja executando um programa”.
Fujitsu provocado a tecnologia em novembro de 2023 e, na época, disse que exigia que os programadores usassem uma estrutura de sua própria concepção que permitisse que os aplicativos funcionassem junto com um servidor de alocação de GPU.
O anúncio da Fujitsu na terça-feira não especifica se esse requisito permanece – mas o produto lançado combina o alocador com tecnologia de otimização de processamento de IA para que possa identificar necessidades e alocar recursos por GPU.
O titã da tecnologia afirmou que o middleware exibiu um aumento de 2,25x na eficiência computacional durante os testes na empresa de soluções de câmeras de IA AWL Inc, no provedor de serviços de IA baseado em nuvem Xtreme-D e na operadora espacial de computação em nuvem Morgenrot Inc.
Ele também afirmou que a tecnologia de gerenciamento de memória na ferramenta permite que as GPUs lidem com tarefas que precisam de mais memória do que a presente em um acelerador.
A Fujitsu planeja continuar desenvolvendo a tecnologia para que ela possa funcionar em várias GPUs instaladas em vários servidores. Atualmente está confinado a caixas únicas – então talvez não seja o tipo de coisa que fará um grande cluster de treinamento cantar, mas uma maneira prática de extrair mais de um servidor equipado com GPU.
Dois grandes clientes já começaram a usar a ferramenta – a fintech japonesa Tradom e o provedor de serviços em nuvem Sakura Internet, que em breve iniciará um estudo de viabilidade para empregá-la em suas operações de datacenter.
Sempre herói, a Fujitsu afirmou que o middleware não apenas usaria totalmente a GPU, mas também resolveria a escassez global.
“Ao enfrentar os desafios da escassez de GPU e do consumo de energia impulsionados pela crescente procura global por IA, a Fujitsu pretende contribuir para uma maior produtividade empresarial e criatividade dos seus clientes.”
Se a IA realmente proporciona produtividade é uma questão calorosamente contestado ideia. O fato de haver escassez de GPUs não é: os reguladores dos EUA têm expressou preocupação que os fornecedores de aceleradores tornam difícil para qualquer pessoa que não seja hiperscalador adquiri-los, e os fornecedores têm reclamou de longos prazos de entrega do fornecedor líder Nvidia.
Falando em Nvidia, ela tentou tranquilizar os compradores nervosos de que sua próxima geração Aceleradores Blackwell em breve sairão das linhas de produção em grande número.
Mas mesmo que a Nvidia e seu principal concorrente, a AMD, possam fornecer mais hardware, a Fujitsu não está sozinha na oferta de ferramentas e serviços de compartilhamento de GPU. Embora a bolha da IA esteja esperado Para estourar em algum momento, organizações de todos os tipos estão correndo para colocar a IA generativa em funcionamento, criando uma enorme demanda por GPUs e datacenters. ®