Ampere se une à Qualcomm para lançar um servidor de IA baseado em Arm – SofolFreelancer


Ampere e Qualcomm não são os parceiros mais óbvios. Afinal, ambos oferecem chips baseados em Arm para executar servidores de data center (embora o maior mercado da Qualcomm continue sendo móvel). Mas, como as duas empresas anunciaram hoje, elas agora estão combinando forças para oferecer um servidor focado em IA que usa CPUs da Ampere e chips de inferência Cloud AI100 Ultra AI da Qualcomm para modelos de execução – e não de treinamento.

Como qualquer outro fabricante de chips, a Ampere busca lucrar com o boom da IA. O foco da empresa, no entanto, sempre foi em chips de servidor rápidos e com baixo consumo de energia, portanto, embora possa usar o Arm IP para adicionar alguns desses recursos aos seus chips, não é necessariamente uma competência essencial. É por isso que a Ampere decidiu trabalhar com a Qualcomm (e a SuperMicro para integrar as duas soluções), disse-me o CTO da Arm, Jeff Wittich.

“A ideia aqui é que, embora eu mostre um ótimo desempenho para CPUs Ampere executando inferência de IA apenas nas CPUs, se você quiser escalar para modelos ainda maiores – modelos com vários parâmetros de 100 bilhões, por exemplo – assim como todos nas outras cargas de trabalho, a IA não é de tamanho único”, disse Wittich ao TechCrunch. “Temos trabalhado com a Qualcomm nesta solução, combinando nossas CPUs Ampere supereficientes para realizar muitas das tarefas de uso geral que você está executando em conjunto com inferência e, em seguida, usando suas placas realmente eficientes, temos um solução em nível de servidor.”

Quanto à parceria com a Qualcomm, Wittich disse que a Ampere queria reunir as melhores soluções.

“[R]Foi realmente uma boa colaboração que tivemos com a Qualcomm aqui”, disse ele. “Essa é uma das coisas em que estamos trabalhando. Acho que compartilhamos muitos interesses muito semelhantes, e é por isso que acho que isso é realmente atraente. Eles estão construindo soluções muito, muito eficientes e em muitas partes diferentes do mercado. Estamos construindo soluções realmente eficientes no lado da CPU do servidor.”

A parceria com a Qualcomm faz parte da atualização anual do roteiro da Ampere. Parte desse roteiro é o novo chip AmpereOne de 256 núcleos, construído usando um processo moderno de 3 nm. Esses novos chips ainda não estão disponíveis, mas Wittich diz que eles estão prontos na fábrica e devem ser lançados ainda este ano.

Além dos núcleos adicionais, a característica definidora desta nova geração de chips AmpereOne é a RAM DDR5 de 12 canais, que permite aos clientes do data center da Ampere ajustar melhor o acesso à memória de seus usuários de acordo com suas necessidades.

O discurso de vendas aqui não é apenas o desempenho, mas o consumo de energia e o custo para operar esses chips no data center. Isso é especialmente verdadeiro quando se trata de inferência de IA, onde Ampere gosta de comparar seu desempenho com as GPUs A10 da Nvidia.

É importante notar que a Ampere não está abandonando nenhum de seus chips existentes em favor desses novos. Wittich enfatizou que mesmo esses chips mais antigos ainda têm muitos casos de uso.

Ampere também anunciou outra parceria hoje. A empresa está trabalhando com NETINT para construir uma solução conjunta que combine as CPUs da Ampere com os chips de processamento de vídeo da NETINT. Este novo servidor será capaz de transcodificar 360 canais de vídeo ao vivo em paralelo, ao mesmo tempo que usa OpenAI’s Sussurrar modelo de fala para texto para legendar 40 streams.

“Começamos a trilhar esse caminho há seis anos porque está claro que é o caminho certo”, disse a CEO da Ampere, Renee James, no anúncio de hoje. “Baixa potência costumava ser sinônimo de baixo desempenho. Ampere provou que isso não é verdade. Fomos pioneiros na fronteira da eficiência da computação e entregamos desempenho além das CPUs legadas em um envelope de computação eficiente.”

Leave a Reply