Google apresenta sétima geração do seu chip acelerador de IA
O Ironwood é o primeiro chip do Google projetado especificamente para inferência — a etapa de execução de modelos de IA. Ele será disponibilizado em clusters com 256 e 9.216 unidades.
De acordo com benchmarks internos, o chip é capaz de atingir até 4.614 TFLOPs de potência computacional. Cada chip conta com 192 GB de memória RAM dedicada e largura de banda de aproximadamente 7,4 Tbps. A arquitetura da TPU foi desenvolvida para reduzir ao máximo a movimentação de dados e a latência dentro do próprio chip, segundo a empresa.
O lançamento está previsto ainda para este ano para clientes do Google Cloud. Em um segundo momento, o chip também será integrado ao Hypercomputer de IA do Google, um cluster de computação modular em nuvem.