A Tensordyne, uma startup com escritórios em Sunnyvale e Munique, anunciou seu processador de inferência de IA Napier (TDN) em 15 de junho, afirmando que seu sistema em escala de rack TDN72 oferece 13 vezes mais throughput em tokens por segundo e 17 vezes mais tokens por watt em comparação com o rack Nvidia GB300 NVL72. O benchmark de comparação: cargas de trabalho de inferência DeepSeek-R1.
Os números por trás da reivindicação
A Tensordyne afirma que um único rack executando seu hardware pode gerar aproximadamente 363.000 tokens por segundo. A empresa estima que o rack equivalente da Nvidia produz aproximadamente 27.400 tokens por segundo na mesma carga de trabalho.
A "secret sauce" é algo chamado sistema numérico logarítmico, ou LNS, executado diretamente em hardware. Em vez de realizar operações matemáticas da maneira como os chips convencionais fazem (multiplicando grandes números de ponto flutuante), o LNS converte a multiplicação em adição, o que é drasticamente mais barato em termos de transistores e energia. É uma técnica estudada na academia por décadas, mas historicamente considerada muito imprática para silício de produção.
A Tensordyne desenvolveu seu chip Napier no processo de 3 nm da TSMC, integrando memórias SRAM e HBM no pacote. A configuração completa de rack empilha quatro pods, cada um com 72 chips, totalizando 288 chips, com uma meta de consumo de energia de aproximadamente 120 kW para todo o rack. Isso é resfriado por ar, não por líquido.
A empresa desenvolveu seu interconector de escalonamento de alta velocidade em colaboração com a Broadcom e a HPE Juniper. A Broadcom contribui com expertise em desenvolvimento de silício, e a HPE Juniper fornece capacidade de interconexão de data centers.
Cronograma de produção e sinais de demanda
A Tensordyne afirma ter acumulado mais de US$ 200 milhões em cartas de intenção e avaliações. A produção em massa tem como alvo o meio de 2027, com envios iniciais esperados para o final de 2026.
A proposta da empresa aos clientes é que cada rack poderia gerar dezenas de milhões de dólares a mais em receita anual em comparação com uma implantação equivalente da Nvidia.
Por que isso importa para o mercado de hardware de IA
Cargas de trabalho de inferência são mais previsíveis do que treinamento e podem ser otimizadas para arquiteturas de modelo específicas. Ao se concentrar exclusivamente na inferência, em vez de competir em toda a pilha de treinamento e inferência, a Tensordyne contorna as principais vantagens competitivas da Nvidia.
A escolha do processo de 3 nm da TSMC coloca a Tensordyne aproximadamente no mesmo nó de fabricação que os próximos chips da Nvidia, o que significa que a diferença de desempenho, se real, vem da inovação arquitetural e não de uma vantagem no nó de processo.
Os investidores devem ficar atentos à validação de referência de terceiros, que deve chegar aproximadamente na época dos envios iniciais no final de 2026.
