A indústria de IA está prestes a atingir um ponto de inflexão. Segundo a Epoch AI, uma organização sem fins lucrativos que rastreia tendências de inteligência artificial, o poder de computação dedicado à execução de modelos de IA crescerá mais rapidamente do que o poder de computação usado para construí-los até 2030.
Os números por trás da mudança
As projeções da Epoch AI pintam um cenário de uma indústria onde a economia de implantação passará a dominar a economia de desenvolvimento. A organização estima que quase metade de todo o cálculo de inferência migrará para ASICs, ou Circuitos Integrados Específicos para Aplicações, até o final da década. Esses são chips projetados para fazer uma única coisa extremamente bem, ao contrário das GPUs de propósito geral que atualmente impulsionam a maioria das cargas de trabalho de IA.
Enquanto isso, a participação da computação de treinamento nas operações totais de IA está projetada para se manter estável em cerca de 5%. A computação de treinamento para modelos de IA de ponta está atualmente crescendo a uma taxa anual de 4 a 5 vezes. A base total de computação de IA instalada está se expandindo em ritmo semelhante.
Historicamente, a inferência já representou 60% a 80% do cálculo em implementações reais.
Até 2030, espera-se que as execuções de treinamento de ponta alcancem aproximadamente 2e29 FLOP. Essa progressão é comparável à transição do GPT-2 para o GPT-4, sustentada por recursos com custo superior a US$ 100 bilhões. Cada uma dessas execuções de treinamento de ponta pode exigir entre 4 e 16 gigawatts de poder computacional.
Os projetos de IA da Epoch estimam que a capacidade total de potência de IA nos EUA pode ultrapassar 50 GW até 2030, com capacidade global excedendo 100 GW.
Por que os ASICs estão consumindo a inferência
O Google descobriu isso há anos com suas Unidades de Processamento Tensorial. A Amazon tem seus chips Inferentia. A tendência projetada pela Epoch AI sugere que isso não é uma estratégia de nicho, mas a direção que cerca de metade do mercado de inferência adotará até o fim da década.
As restrições a essa trajetória de crescimento não são triviais. A demanda por energia, a capacidade de produção de chips e as limitações de transferência de dados representam desafios reais. A avaliação da Epoch AI é que esses gargalos são gerenciáveis sob as suposições atuais de crescimento.
O que isso significa para os investidores
Se o cálculo de inferência é onde o crescimento está se direcionando, a tese de investimento para o setor de semicondutores muda significativamente. O treinamento ainda exige GPUs, e os orçamentos de treinamento ainda crescem anualmente de 4 a 5 vezes. Mas a oportunidade de receita recorrente e de maior volume cada vez mais reside na inferência.
Quando se fala em 50 GW de capacidade de potência de IA apenas nos EUA, trata-se de uma expansão massiva de data centers, geração de energia e sistemas de refrigeração.
O risco a observar é se a taxa de crescimento anual de 4 a 5x no cálculo é sustentável. As projeções da Epoch AI assumem que as trajetórias atuais se mantêm, mas restrições energéticas e dinâmicas geopolíticas na oferta de chips podem introduzir atritos.
