NVIDIA Rubin SOCAMM Memory Cut Gây Hoảng Lo Thị Trường và Giảm MU

Bài viết: Triều Hướng Nghiên Cứu

Vào sáng ngày 4 tháng 6, tổ chức nghiên cứu độc lập có ảnh hưởng nhất trong ngành bán dẫn, SemiAnalysis, đã đăng một bản tin sáng.

Thông điệp cốt lõi chỉ gồm một câu: Dung lượng DRAM SOCAMM trên mỗi kệ của NVIDIA Vera Rubin NVL72 có thể giảm từ khoảng 55TB như dự kiến trước đây xuống còn khoảng 28TB. Hầu hết các hệ thống Rubin sẽ sử dụng module SOCAMM 96GB, thay vì 192GB như hầu hết thị trường kỳ vọng trước đây.

Sau khi tin tức lan truyền, phản ứng của thị trường đơn giản và thô bạo: nhu cầu bộ nhớ bị cắt giảm một nửa, gây áp lực giảm giá cho Micron. MU đã giảm hơn 10% trong phiên giao dịch, từ mức cao kỷ lục mới 1.089 USD đạt được vào ngày hôm trước rơi xuống còn 971 USD, xóa bay hơn 100 tỷ USD giá trị thị trường trong một ngày.

Sự hoảng loạn là có thật, nhưng vấn đề là hướng của sự hoảng loạn có đúng không?

Hãy tính toán rõ ràng đã

Vera Rubin NVL72 là kệ siêu máy tính AI thế hệ tiếp theo của NVIDIA. Mỗi kệ chứa 72 con GPU Rubin và 36 con CPU Vera. Về phía GPU, vẫn sử dụng HBM4, mỗi con 288GB, tổng cộng khoảng 20,7 TB, phần này không thay đổi. Điều thay đổi nằm ở phía CPU.

Mỗi CPU Vera có 8 khe cắm SOCAMM, mỗi khe có thể cắm các module có dung lượng khác nhau. Thông số kỹ thuật chính thức do NVIDIA công bố tại CES 2026 là "mỗi CPU Vera hỗ trợ tối đa 1,5 TB LPDDR5X", tương ứng với cấu hình đầy 8 module 192 GB. Với 36 CPU, tổng dung lượng là 54 TB.

Báo cáo của SemiAnalysis cho biết: Việc cấu hình xuất hàng thực tế rất có thể sẽ không được lắp đầy. Hầu hết các hệ thống sẽ sử dụng mô-đun 96GB, 8×96GB = 768GB mỗi CPU, 36 CPU sẽ cho tổng cộng khoảng 28TB.

Từ 55TB xuống còn 28TB, dung lượng giảm gần một nửa, những người viết tiêu đề giật tít sẽ nói là "nhu cầu bộ nhớ giảm một nửa".

Nhưng khoản này, thị trường đã tính sai một biến số quan trọng.

Lỗ hổng logic của sự hoảng loạn

Đầu tiên, SOCAMM được thiết kế dạng khe cắm, không phải hàn cố định.

Đây là chi tiết kỹ thuật dễ bị bỏ qua nhất trong toàn bộ câu chuyện. Khác với GB300 Blackwell Ultra sử dụng LPDDR hàn cố định trên bo mạch chủ, nền tảng Vera Rubin sử dụng mô-đun SOCAMM2 chuẩn JEDEC, có thể tháo lắp, thay thế nóng và nâng cấp sau này. Hôm nay cắm 96GB, ngày mai nếu khách hàng có nhu cầu, chỉ cần tháo ra và thay bằng 192GB hoặc thậm chí 256GB, đơn giản như thay thanh RAM.

NVIDIA đã nhấn mạnh thiết kế này tại CES 2026: thời gian lắp ráp toàn bộ khay tính toán đã được rút ngắn từ 2 giờ xuống còn 5 phút. Tính mô-đun, dễ bảo trì và có thể nâng cấp là một trong những tiến hóa kiến trúc lớn nhất của Vera Rubin so với Blackwell.

Giảm cấu hình bán ra ban đầu không có nghĩa là nhu cầu vĩnh viễn biến mất. Nó giống như một chiến lược "lên xe trước, mua vé sau".

Thứ hai, lý do giảm dung lượng không phải vì không cần, mà là “không đủ dùng”.

Dylan Patel, người sáng lập SemiAnalysis, đã nói một câu đầy ý nghĩa trên Twitter: “Tôi rất thích một điều, đó là những người chia sẻ báo cáo của chúng tôi lại bỏ sót phần lớn nội dung trong báo cáo. Việc này thường xuyên xảy ra.”

Các bình luận của độc giả trên Digg về bài tin này cũng rất minh họa: 77,8% bình luận cho rằng việc lan truyền lại là những tiêu đề câu view cắt xén ngữ cảnh.

Điều bị bỏ sót là gì? Là bối cảnh.

Nhu cầu toàn cầu về LPDDR5X vào năm 2026 sẽ cực kỳ căng thẳng. Micron đã khẳng định rõ ràng tại hội nghị Wolfe vào cuối tháng 5 rằng nhu cầu bộ nhớ vượt xa khả năng cung cấp, và tình trạng này dự kiến sẽ kéo dài sau năm 2026. Công suất HBM của Micron cho cả năm tài chính 2026 đã được bán hết sạch, giá trung bình của DRAM tăng hơn 110% so với cùng kỳ năm trước, biên lợi nhuận gộp tăng vọt lên 74%. Samsung và SK Hynix cũng đang sản xuất và tiêu thụ hết công suất.

Trong bối cảnh này, vấn đề mà NVIDIA gặp phải không phải là khách hàng không muốn nhiều bộ nhớ hơn, mà là “Tôi không thể có đủ chip LPDDR5X để lấp đầy từng khe cắm”.

Giảm cấu hình SOCAMM mặc định trên mỗi kệ về cơ bản là một biện pháp quản lý chuỗi cung ứng ở cấp độ kỹ thuật: thay vì để toàn bộ kệ bị trì hoãn giao hàng do thiếu bộ nhớ, hãy giao hàng với cấu hình thấp hơn để công suất tính toán được đưa vào hoạt động nhanh nhất có thể.

Đây không phải là tín hiệu của sự thu hẹp nhu cầu, mà ngược lại, đây là tín hiệu cho thấy nhu cầu vượt trội hơn nguồn cung.

Thứ ba, ít bộ nhớ hơn không có nghĩa là ít kệ hơn.

Thị trường đã thực hiện một phép nhân đơn giản: giảm một nửa bộ nhớ mỗi khay → tổng nhu cầu giảm một nửa. Nhưng bài toán này còn một biến số khác: khối lượng xuất kho.

Nếu mỗi khung SOCAMM giảm từ 55TB xuống 28TB, NVIDIA có thể lắp đặt nhiều khung hơn cùng một ràng buộc nguồn cung LPDDR5X. Trước đây, một lô bộ nhớ chỉ đủ lắp 100 khung, bây giờ đủ lắp gần 200 khung.

Tổng lượng LPDDR5X được tiêu thụ không giảm, mà chỉ được phân bổ sang nhiều kệ hơn. Đối với NVIDIA, đây là lựa chọn thực tế để đưa Rubin ra thị trường nhanh hơn; đối với các nhà sản xuất bộ nhớ, tổng đơn hàng có thể không giảm.

Hơn nữa, nhu cầu bộ nhớ phía CPU trong các kịch bản suy luận có độ linh hoạt rất lớn. Không phải tất cả các tải công việc đều cần 1,5 TB LPDDR5X. Việc huấn luyện mô hình lớn thực sự tốn bộ nhớ, nhưng nhiều tác vụ suy luận, đặc biệt là agentic AI và suy luận với ngữ cảnh dài, bộ nhớ KV cache có thể được điều phối linh hoạt giữa HBM và LPDDR thông qua NVLink-C2C. Đối với nhiều khách hàng, 768 GB bộ nhớ phía CPU đã đủ dùng.

Vậy tại sao Micron lại giảm 10%?

Vì SemiAnalysis chỉ là sợi rơm thứ hai làm con lạc đà gục ngã.

Sợi rơm đầu tiên là Broadcom. Trước khi thị trường Mỹ mở cửa vào ngày 4 tháng 6, Broadcom công bố báo cáo tài chính quý 2. Con số không tệ: doanh thu 22,19 tỷ USD, tăng 48% so với cùng kỳ năm trước, EPS Non-GAAP 2,44 USD vượt kỳ vọng. Tuy nhiên, CEO Trần Phúc Dương không điều chỉnh tăng hướng dẫn doanh thu chip AI cả năm lên 100 tỷ USD, khiến thị trường cảm thấy "chưa đủ". Giá cổ phiếu Broadcom lao dốc 15%, kéo theo toàn bộ ngành bán dẫn cùng giảm mạnh.

Ngày hôm đó, Micron không có bất kỳ tin tiêu cực nào ở cấp độ công ty. Nhiều phương tiện truyền thông như TipRanks, Motley Fool, 24/7 Wall St. đều rõ ràng chỉ ra rằng đây là một đợt giảm giá "liên quan đến cá vô tội". Micron, với tư cách là tài sản cốt lõi trong chuỗi bộ nhớ AI, có mối liên hệ chặt chẽ với tâm lý chi tiêu vốn vào AI; hướng dẫn của Broadcom đã khiến thị trường đánh giá lại tốc độ tăng trưởng kỳ vọng của toàn bộ chuỗi linh kiện AI.

Báo cáo của SemiAnalysis đã lan truyền vào cùng ngày, cung cấp cho các nhà giao dịch đang tìm kiếm lý do để bán một câu chuyện hoàn hảo: không chỉ tâm lý AI toàn cầu suy yếu, mà cả con số cụ thể về nhu cầu bộ nhớ cũng đang thu hẹp.

Một cổ phiếu có vốn hóa thị trường 1 nghìn tỷ USD, trong năm qua tăng 900%, và ngày hôm trước vừa thiết lập mức cao nhất mọi thời đại. Ở vị trí này, bất kỳ tiêu đề tiêu cực nào cũng là chất xúc tác để chốt lời. Sự hoảng loạn không cần đúng, chỉ cần một lý do.

Interpretation of the trend

Ba tiêu chí.

Đầu tiên, báo cáo của SemiAnalysis về cơ bản là chính xác, nhưng thị trường đã diễn giải sai nó. Cấu hình SOCAMM mặc định của Rubin NVL72 rất có thể thấp hơn giá trị tối đa lý thuyết, điều này được xác định bởi thực tế chuỗi cung ứng và độ co giãn của nhu cầu khách hàng. Tuy nhiên, giữa việc "giảm cấu hình mặc định" và "suy giảm nhu cầu bộ nhớ" lại tồn tại một kiến trúc mô-đun có thể nâng cấp thay thế, cùng với thực tế ngành công nghiệp mà nhu cầu vượt xa nguồn cung.

Thứ hai, rủi ro cốt lõi hiện tại của Micron không nằm ở SOCAMM, mà ở HBM4. SemiAnalysis đã báo cáo vào tháng 2 năm nay rằng trong đơn hàng HBM4 cho nền tảng Rubin của NVIDIA, tỷ lệ thị phần của Micron bằng 0, SK Hynix chiếm 70% và Samsung chiếm 30%. Mặc dù Micron đã công bố bắt đầu sản xuất hàng loạt và giao hàng HBM4 vào tháng 3, nhưng dự kiến thị phần của họ chỉ đạt 18%. Ngược lại, vị thế của Micron trong lĩnh vực SOCAMM rất vững chắc: họ là nhà cung cấp đầu tiên ra mắt SOCAMM2 256GB và là đối tác cốt lõi của NVIDIA trong giải pháp SOCAMM suốt năm năm qua. Việc giảm cấu hình SOCAMM ảnh hưởng thực tế đến Micron ít hơn nhiều so với việc bị loại khỏi thị phần HBM4.

Thứ ba, bản chất của đợt giảm giá này là việc thu lợi từ cổ phiếu có vốn hóa nghìn tỷ sau khi đạt mức cao kỷ lục, được hai yếu tố kích hoạt độc lập khuếch đại. Broadcom tạo ra cú sốc tâm lý, trong khi SemiAnalysis cung cấp nhiên liệu cho câu chuyện. Sự kết hợp của cả hai đã khiến một cổ phiếu tăng 9 lần trong 12 tháng qua điều chỉnh 10%. Về mặt giao dịch, điều này không gọi là "hoảng loạn", mà gọi là "bình thường".

Dylan Patel nói đúng: hầu hết những người chia sẻ lại bài báo của anh ấy đều đã bỏ sót phần quan trọng nhất trong báo cáo.

Điều nguy hiểm nhất trong đầu tư bán dẫn không phải là dự đoán sai hướng đi, mà là nhìn đúng tiêu đề nhưng tính sai công thức.