Cạnh tranh trong cơ sở hạ tầng AI đang mở rộng từ GPU sang khâu bộ nhớ. Công ty khởi nghiệp chip XCENA, hoạt động tại Hàn Quốc và Hoa Kỳ, đã hoàn thành vòng gọi vốn B trị giá 135 triệu USD, với định giá sau vòng gọi vốn là 570 triệu USD. Công ty cho rằng, áp lực chi phí trong giai đoạn suy luận của AI sinh ra không chỉ đến từ chip tính toán, mà còn đến từ quá trình di chuyển dữ liệu lặp đi lặp lại giữa CPU, GPU và bộ nhớ.
Định giá sau khi huy động vốn tăng lên 570 triệu USD
Sau vòng huy động vốn này, XCENA đã huy động được tổng cộng 185 triệu USD. Công ty được đồng sáng lập bởi CEO Jin Kim, CTO Dohun Kim và CPO Harry Juhyun Kim, cả ba đều từng làm việc tại Samsung Electronics và SK Hynix. Hai công ty này là các nhà cung cấp chip lưu trữ hàng đầu toàn cầu và là một phần quan trọng trong chuỗi cung ứng GPU của NVIDIA.
TechCrunch báo cáo rằng XCENA cho rằng việc suy luận AI đang chuyển từ “vấn đề năng lực tính toán” sang “vấn đề mở rộng bộ nhớ”. Khi các mô hình gọi đến ngữ cảnh, bộ nhớ đệm và các quy trình tiền xử lý để tạo ra từng token, dữ liệu được truyền đi truyền lại giữa các chip, gây ra độ trễ, tiêu thụ năng lượng và chi phí phần cứng bổ sung.
Chip di chuyển một phần tính toán đến gần bộ nhớ
Sản phẩm của XCENA có tên MX1, hiện vẫn đang ở giai đoạn nguyên mẫu. Chip này kết nối với CPU thông qua CXL, chuyển một phần nhiệm vụ xử lý dữ liệu đến gần vị trí DRAM hơn, giảm thiểu việc dữ liệu phải di chuyển qua lại giữa CPU, GPU và bộ nhớ.
Công ty cho biết, các nhiệm vụ này bao gồm tiền xử lý, quản lý bộ nhớ đệm KV và bộ nhớ đệm dữ liệu. Theo họ, công việc vốn có thể cần 10 máy chủ thực hiện trong một số trường hợp cụ thể có thể được thu gọn xuống chỉ còn 1 máy chủ. Tuy nhiên, hiệu quả này vẫn cần được xác minh thông qua việc triển khai quy mô lớn.
Kế hoạch sản xuất hàng loạt vào cuối năm 2026
XCENA dự kiến chip sản xuất hàng loạt sẽ được sản xuất tại nhà máy sản xuất wafer của Samsung vào cuối năm 2026 và bắt đầu tạo doanh thu vào năm 2027. Khách hàng mục tiêu hiện tại của công ty là các nhà cung cấp dịch vụ đám mây quy mô siêu lớn, những người chi hàng chục tỷ đô la Mỹ mỗi năm cho cơ sở hạ tầng AI, vì ngay cả việc cải thiện hiệu suất bộ nhớ một phần nhỏ cũng có thể mang lại tiết kiệm chi phí ở mức hàng trăm triệu đô la Mỹ.
Công ty cho biết, kể từ nửa cuối năm ngoái, nhu cầu thị trường đối với các giải pháp liên quan đến bộ nhớ đã tăng rõ rệt, hiện đã bắt đầu tiếp xúc sớm với nhiều nhà sản xuất bộ nhớ toàn cầu, nhưng chưa tiết lộ danh sách cụ thể.
Đối thủ bao gồm Astera Labs và Marvell
Trong bối cảnh cạnh tranh, XCENA xem Astera Labs và Marvell là những đối thủ gần gũi. Cả hai công ty đều đang thúc đẩy các giải pháp kết nối bộ nhớ thế hệ tiếp theo, trong đó Marvell đã là một doanh nghiệp niêm yết trưởng thành.
XCENA cho rằng sự khác biệt chính nằm ở kiến trúc bên trong chip. Công ty cho biết giải pháp của họ dựa trên RISC-V, sử dụng nhiều lõi xử lý dữ liệu nhỏ, đồng thời tự phát triển cấp bộ nhớ, bus liên kết và bộ điều khiển DRAM, thay vì giao những khâu này cho bên thứ ba.
Đợt huy động vốn này do các quỹ đầu tư mạo hiểm Hàn Quốc Altinum và IMM Investment đồng dẫn đầu, với sự tham gia của Corstone Asia và các cổ đông hiện tại SBI Investment, Mirae Asset Capital. XCENA hiện có văn phòng tại Banqiao, Hàn Quốc và Sunnyvale, Hoa Kỳ, với tổng số nhân viên vượt quá 90 người, và đang thảo luận về các đợt huy động vốn tiếp theo với các nhà đầu tư quốc tế.
