A competição na infraestrutura de IA está se expandindo dos GPUs para o componente de memória. A startup de chips XCENA, com operações na Coreia do Sul e nos EUA, concluiu um financiamento da série B de US$ 135 milhões, com avaliação pós-investimento de US$ 570 milhões. A empresa acredita que a pressão de custo na fase de inferência da IA generativa não vem apenas dos chips de processamento, mas também do processo repetitivo de transferência de dados entre CPU, GPU e memória.
A avaliação pós-financiamento subiu para US$ 570 milhões
Após este round de financiamento, o XCENA acumulou um total de US$ 185 milhões em financiamento. A empresa foi fundada conjuntamente pelo CEO Jin Kim, CTO Dohun Kim e CPO Harry Juhyun Kim, todos os quais já trabalharam na Samsung Electronics e na SK Hynix. Essas duas empresas são principais fornecedoras globais de chips de armazenamento e partes importantes da cadeia de suprimentos de GPUs da NVIDIA.
A TechCrunch relata que, segundo a XCENA, a inferência de IA está passando de um "problema de poder de processamento" para um "problema de expansão de memória". À medida que os modelos chamam contextos, caches e processos de pré-processamento para gerar cada token, os dados são transmitidos constantemente entre diferentes chips, gerando latência adicional, consumo de energia e custos de hardware.
O chip antecipa parte do cálculo para ao lado da memória
O produto da XCENA é chamado MX1 e ainda está na fase de protótipo. O chip se conecta ao CPU por meio de CXL, transferindo parte das tarefas de processamento de dados para mais perto da DRAM, reduzindo a ida e volta de dados entre CPU, GPU e memória.
A empresa afirma que essas tarefas incluem pré-processamento, gerenciamento de cache KV e cache de dados. Segundo ela, o trabalho que originalmente poderia exigir 10 servidores tem potencial para ser reduzido a apenas um servidor em cenários específicos. No entanto, esse efeito ainda precisa ser validado por uma implantação em larga escala.
Planejar produção em massa até o final de 2026
A XCENA espera que os chips em produção em massa sejam lançados da linha de fabricação da Samsung Foundry até o final de 2026 e comecem a gerar receita em 2027. Os clientes-alvo atuais da empresa são provedores de nuvem de grande escala que investem centenas de bilhões de dólares anualmente em infraestrutura de IA, pois mesmo um pequeno aumento na eficiência de memória pode resultar em economias de custos na ordem de centenas de milhões de dólares.
A empresa afirmou que, desde o segundo semestre do ano passado, a demanda por soluções relacionadas a memória aumentou significativamente, e atualmente está em contato inicial com várias fabricantes globais de armazenamento, mas não divulgou os nomes específicos.
Os concorrentes incluem Astera Labs e Marvell
No cenário competitivo, a XCENA considera a Astera Labs e a Marvell como concorrentes próximos. Ambas as empresas estão avançando com soluções de interconexão de memória da próxima geração, sendo que a Marvell já é uma empresa estabelecida e cotada em bolsa.
A XCENA acredita que suas diferenças principais estão na arquitetura interna do chip. A empresa afirma que sua solução é baseada em RISC-V, utilizando um grande número de pequenos núcleos de processamento de dados, além de desenvolver internamente a hierarquia de memória, o barramento de interconexão e o controlador DRAM, em vez de terceirizar essas etapas.
Esta rodada de financiamento foi liderada conjuntamente pelas instituições de capital de risco sul-coreanas Altinum e IMM Investment, com participação também de Corstone Asia e dos acionistas anteriores SBI Investment e Future Asset Capital. A XCENA atualmente possui escritórios em Banqiao, Coreia do Sul, e em Sunnyvale, Estados Unidos, com mais de 90 funcionários, e está em negociações com investidores internacionais para uma próxima rodada de financiamento.
