La concurrence dans les infrastructures d'IA s'étend des GPU aux composants mémoire. La startup de semi-conducteurs XCENA, opérant en Corée du Sud et aux États-Unis, a levé 135 millions de dollars lors de son tour B, avec une valorisation post-financement de 570 millions de dollars. L'entreprise estime que la pression sur les coûts de l'IA générative lors de la phase d'inférence ne provient pas uniquement des puces de calcul, mais aussi des transferts répétés de données entre le CPU, le GPU et la mémoire.
La valorisation après financement atteint 570 millions de dollars américains
Après ce tour de financement, XCENA a levé au total 185 millions de dollars. L'entreprise a été fondée conjointement par le PDG Jin Kim, le CTO Dohun Kim et le CPO Harry Juhyun Kim, tous trois anciens employés de Samsung Electronics et SK Hynix. Ces deux entreprises sont parmi les principaux fournisseurs mondiaux de puces de stockage et constituent un maillon essentiel de la chaîne d'approvisionnement des GPU NVIDIA.
TechCrunch rapporte que, selon XCENA, l'inférence IA passe d'un problème de puissance de calcul à un problème d'extension de mémoire. À mesure que les modèles appellent le contexte, le cache et les processus de prétraitement pour générer chaque token, les données sont transférées en continu entre différents puces, entraînant des retards supplémentaires, une consommation d'énergie accrue et des coûts matériels plus élevés.
La puce déplace une partie du calcul à côté de la mémoire.
Le produit d'XCENA s'appelle MX1 et est actuellement à l'état de prototype. Ce puce se connecte au CPU via CXL, déplaçant certaines tâches de traitement de données plus près de la DRAM pour réduire les déplacements de données entre le CPU, le GPU et la mémoire.
L'entreprise affirme que ces tâches incluent la prétraitement, la gestion du cache KV et le cache de données. Selon elle, le travail qui nécessitait initialement 10 serveurs pourrait, dans certains scénarios, être réduit à un seul serveur. Toutefois, cet effet reste à valider lors d'un déploiement à grande échelle.
Plan de production de masse fin 2026
XCENA prévoit que les puces en série seront produites à la fin de 2026 sur les lignes de fabrication de Samsung Foundry et commenceront à générer des revenus en 2027. Les clients cibles actuels de l'entreprise sont les fournisseurs de cloud à très grande échelle qui investissent des centaines de milliards de dollars par an dans les infrastructures AI, car même une légère amélioration de l'efficacité mémoire pourrait générer des économies de coûts de plusieurs centaines de millions de dollars.
L'entreprise a indiqué que la demande pour les solutions liées à la mémoire a nettement augmenté depuis le deuxième semestre de l'année dernière ; elle a déjà entamé des contacts initiaux avec plusieurs fabricants mondiaux de stockage, sans toutefois révéler les noms spécifiques.
Les concurrents incluent Astera Labs et Marvell
Sur le plan de la concurrence, XCENA considère Astera Labs et Marvell comme des concurrents directs. Les deux entreprises développent des solutions de mémoire interconnectée de prochaine génération, et Marvell est déjà une entreprise cotée établie.
XCENA estime que ses différences principales résident dans l'architecture interne des puces. L'entreprise affirme que sa solution repose sur RISC-V, utilise de nombreux petits cœurs de traitement de données, et a conçu en interne les niveaux de mémoire, le bus d'interconnexion et le contrôleur DRAM, au lieu de sous-traiter ces composants à des tiers.
Ce tour de financement est mené conjointement par les investisseurs coréens Altinum et IMM Investment, avec la participation de Corstone Asia ainsi que des actionnaires existants SBI Investment et Future Asset Capital. XCENA dispose actuellement de bureaux à Banqiao en Corée et à Sunnyvale aux États-Unis, compte plus de 90 employés, et est actuellement en discussions avec des investisseurs internationaux pour un prochain financement.
