Microsoft pretende substituir maioria das GPUs da AMD e Nvidia por chips próprios
O principal motivo é o desempenho por dólar, uma métrica fundamental para provedores de nuvem em larga escala. Kevin Scott, diretor de tecnologia da empresa, explica que, até agora, a Nvidia oferecia a melhor relação custo-benefício, mas que a Microsoft está disposta a considerar qualquer alternativa que atenda à crescente demanda por processamento.
Segundo Scott, a meta é que os chips próprios da Microsoft passem a ser utilizados na maioria das cargas de trabalho de IA em seus data centers, com a expectativa de que, a longo prazo, os servidores da empresa sejam compostos majoritariamente por hardware desenvolvido internamente.
Com o lançamento do Maia 100, seu primeiro acelerador de IA proprietário, a Microsoft conseguiu liberar capacidade de GPUs ao transferir o modelo GPT-3.5 da OpenAI para esse chip em 2023. No entanto, o chip ainda apresentou desempenho inferior às GPUs concorrentes da Nvidia e da AMD.
A companhia agora trabalha no desenvolvimento de uma segunda geração do acelerador, o Maia 200, prevista para ser lançada no próximo ano. A nova versão deve oferecer grandes avanços em computação, memória e interconexão.