Tensordyne revendique une augmentation de débit de 13 fois par rapport au rack AI Nvidia GB300 NVL72

Tensordyne, une startup ayant des bureaux à Sunnyvale et Munich, a annoncé son processeur d'inférence AI Napier (TDN) le 15 juin, affirmant que son système à échelle de baie TDN72 offre un débit 13 fois supérieur en tokens par seconde et 17 fois plus de tokens par watt que le rack Nvidia GB300 NVL72. Le benchmark de comparaison : charges de travail d'inférence DeepSeek-R1.

Les chiffres derrière la réclamation

Tensordyne affirme qu'une seule baie exécutant son matériel peut produire environ 363 000 jetons par seconde. L'entreprise évalue la baie équivalente de Nvidia à environ 27 400 jetons par seconde sur la même charge de travail.

La sauce secrète est un système numérique logarithmique, ou LNS, exécuté directement en matériel. Au lieu d'effectuer des calculs comme le font les puces classiques (multipliant des nombres à virgule flottante), le LNS convertit la multiplication en addition, ce qui est considérablement moins coûteux en termes de transistors et d'énergie. C'est une technique étudiée dans le milieu académique depuis des décennies, mais qui a historiquement été trop impraticable pour la production de silicium.

Tensordyne a conçu sa puce Napier sur le nœud 3 nm de TSMC, en intégrant à la fois la mémoire SRAM et la mémoire HBM sur le package. La configuration complète de baie empile quatre pods de 72 puces chacun, soit un total de 288 puces, avec une consommation cible d’environ 120 kW pour l’ensemble de la baie. C’est refroidi par air, pas par liquide.

L'entreprise a développé son interconnexion à mise à l'échelle haute vitesse en collaboration avec Broadcom et HPE Juniper. Broadcom apporte son expertise en développement de silicium, et HPE Juniper fournit la capacité d'interconnexion de centre de données.

Calendrier de production et signaux de demande

Tensordyne affirme avoir accumulé plus de 200 millions de dollars en lettres d'intention et évaluations. La production de masse est prévue pour mi-2027, avec des expéditions initiales attendues à la fin de 2026.

L'entreprise promet à ses clients que chaque baie pourrait générer des dizaines de millions de dollars de revenus annuels supplémentaires par rapport à un déploiement équivalent Nvidia.

Pourquoi cela compte pour le marché du matériel IA

Les charges de travail d’inférence sont plus prévisibles que celles d’entraînement et peuvent être optimisées pour des architectures de modèles spécifiques. En se concentrant exclusivement sur l’inférence plutôt que de concourir sur l’ensemble de la pile entraînement-inférence, Tensordyne contourne les avantages concurrentiels les plus forts de Nvidia.

Le choix du procédé TSMC 3 nm place Tensordyne à peu près au même nœud de fabrication que les prochaines puces de Nvidia, ce qui signifie que l'écart de performance, s'il existe, provient d'une innovation architecturale plutôt que d'un avantage lié au nœud de fabrication.

Les investisseurs doivent surveiller la validation par un tiers, qui devrait arriver vers la période des premières livraisons à la fin de 2026.