Một báo cáo chuỗi cung ứng về tủ Rubin của NVIDIA đã khiến phân khúc bộ nhớ AI giảm giá trước tiên.
Báo cáo cho biết dung lượng bộ nhớ trên mỗi tủ máy có thể giảm từ khoảng 55TB xuống còn khoảng 28TB. Sau đó, Micron giảm khoảng 7,7% trong ngày, còn SK Hynix giảm hơn 8% ngay khi mở cửa ngày hôm sau. Đáng chú ý hơn, tác giả báo cáo Dylan Patel sau đó đã làm rõ rằng nhiều bài chia sẻ chỉ trích xuất phần nổi bật nhất, và đây không phải là một báo cáo “tin xấu nghiêm trọng”.
Sự kiện này gây ra phản ứng lớn như vậy vì nó chạm vào vị trí nhạy cảm nhất của chu kỳ phần cứng AI. Trong thời gian qua, thị trường không giao dịch các chu kỳ bộ nhớ thông thường, mà là kỳ vọng rằng sau khi nền tảng Rubin bắt đầu sản xuất hàng loạt, các tủ AI sẽ tiếp tục thúc đẩy nhu cầu đối với HBM và bộ nhớ đi kèm, giúp doanh thu và khả năng định giá của các nhà cung cấp bộ nhớ được nâng cao trở lại. Kể từ GTC năm nay, HBM4, thị phần của SK Hynix, và sự đuổi bắt của Micron trong lĩnh vực bộ nhớ AI đều là những chủ đề mà thị trường liên tục giao dịch.
Nhưng cách nói “bị cắt bộ nhớ” quá thô lỗ.
Các điều chỉnh được SemiAnalysis tiết lộ chủ yếu đề cập đến sự thay đổi trong cấu hình SOCAMM và LPDDR ở phía CPU trong tủ Rubin NVL72. Hầu hết các hệ thống có thể sử dụng mô-đun 96GB thay vì các mô-đun dung lượng cao hơn 192GB, làm giảm dung lượng bộ nhớ trên mỗi tủ từ khoảng 55TB dự kiến xuống còn khoảng 28TB. Sự thay đổi này ảnh hưởng đến giá trị bộ nhớ hệ thống trên mỗi tủ, nhưng chưa thể suy ra trực tiếp rằng nhu cầu về HBM4 ở phía GPU cũng bị giảm theo.
Điều cần làm rõ thực sự là, đợt điều chỉnh này ảnh hưởng đến hồ lợi nhuận nào, và hiện tại thị trường đang giao dịch kỳ vọng nào.
Tại sao cổ phiếu bộ nhớ AI đồng loạt giảm mạnh?
Thị trường giảm là phản ứng của vị thế sau khi các chủ đề cao điểm gặp các từ khóa tiêu cực.
Phần đã được xác nhận hiện tại là phản ứng của thị trường rất mạnh, nhưng sự kiện này vẫn chỉ dừng ở mức báo cáo chuỗi cung ứng. SemiAnalysis tiết lộ rằng NVIDIA có thể giảm cấu hình SOCAMM phía CPU để đảm bảo tiến độ giao hàng của Rubin NVL72. Các con số được đề cập trong báo cáo bao gồm dung lượng bộ nhớ trên một tủ giảm từ khoảng 55TB xuống còn khoảng 28TB, chi phí mỗi tủ giảm từ khoảng 7,6 triệu USD xuống còn khoảng 6,8 triệu USD. Những con số này nên được hiểu theo cách báo cáo của SemiAnalysis và chưa phải là BOM (danh sách vật liệu) cuối cùng được xác nhận chính thức bởi NVIDIA.

Trong vài quý qua, cổ phiếu bộ nhớ AI tăng trưởng nhờ một câu chuyện rất thuận lợi: càng nhiều tủ AI, càng thiếu bộ nhớ tiên tiến, lợi nhuận của nhà cung cấp càng cao.
Câu chuyện càng đơn giản, sức ảnh hưởng của tiêu đề tiêu cực càng lớn. Một khi xuất hiện “ dung lượng bộ nhớ bị giảm một nửa”, thị trường sẽ trước tiên điều chỉnh giảm giá trị bộ nhớ trên mỗi tủ máy chủ, rất ít khi ngay lập tức phân biệt loại bộ nhớ nào bị điều chỉnh.
Phản ứng của Micron là minh chứng rõ ràng nhất.
Nó vừa là nhà cung cấp DRAM truyền thống, vừa là người hưởng lợi từ việc nâng cấp bộ nhớ cho máy chủ AI. Sự linh hoạt mà thị trường từng gán cho nó phần lớn đến từ việc định giá lại rằng “bộ nhớ AI không còn chỉ là hàng chu kỳ”. Nếu dung lượng bộ nhớ trong hệ thống một tủ của Rubin giảm xuống, các nhà đầu tư sẽ lập tức lo ngại rằng kỳ vọng doanh thu trên mỗi tủ của Micron trong các phân khúc SOCAMM và LPDDR có bị thổi phồng quá mức hay không.
SK Hynix cũng giảm theo, cho thấy đợt điều chỉnh này đã vượt ra ngoài phạm vi của một nhà cung cấp duy nhất.
Nó mạnh hơn trong lĩnh vực HBM, trước đó thị trường còn đồn thổi rằng công ty này đã giành phần lớn đơn hàng HBM liên quan đến Vera Rubin. Nhưng khi giao dịch bộ nhớ AI trở nên đông đúc, vốn sẽ không chờ đợi làm rõ tất cả các chi tiết mới hành động. Sự sụt giảm đồng thời của cổ phiếu bộ nhớ phản ánh sự thu hẹp sở thích rủi ro trong ngành, chứ không phải mỗi công ty đều chịu tác động bởi cùng một yếu tố cơ bản.
Sự làm rõ sau đó của Dylan Patel cũng hướng đến điểm này. Anh ấy cho biết báo cáo không có ý định tạo ra câu chuyện “thảm họa”, và nhiều người đã bỏ qua bối cảnh.
Chuyển sang ngôn ngữ thị trường, đó là vốn không thực hiện giao dịch đầy đủ một phân tích chuỗi cung ứng, mà thay vào đó là giảm nhanh vị thế sau khi chạm vào nhóm cổ phiếu cao và gặp từ khóa tiêu cực.
AI memory begins to reallocate the profit pool
Lần này chủ yếu là bộ nhớ hệ thống bên phía CPU bị giảm xuống, chứ không phải HBM4 bên cạnh GPU.
Bộ nhớ trong tủ Rubin không thể tóm tắt bằng một từ duy nhất. Cách phân chia đơn giản nhất là hai lớp:
Lớp đầu tiên là HBM4 bên GPU, phục vụ cho chính chip tăng tốc;
Lớp thứ hai là SOCAMM và LPDDR phía CPU, giống như bộ nhớ vận hành của toàn bộ hệ thống.

Cái trước quyết định tốc độ dữ liệu được cung cấp cho GPU, cái sau ảnh hưởng đến việc lập lịch toàn hệ thống, bảo trì và hiệu suất của một số công việc.
SemiAnalysis đề cập đến "55TB đến 28TB", chủ yếu nằm ở bộ nhớ hệ thống phía CPU.
Nó có thể thay đổi số lượng, dung lượng và số tiền mua sắm của các module SOCAMM trong mỗi tủ Rubin NVL72. Nếu đa số hệ thống chuyển từ module 192GB sang module 96GB, giá trị đơn vị của SOCAMM dung lượng cao trên mỗi máy thực sự giảm, khiến độ co giãn doanh thu của các nhà cung cấp liên quan chịu áp lực.
Tuy nhiên, HBM4 phía GPU là một dòng khác.
Nền tảng Rubin vẫn tập trung vào Rubin GPU và Vera CPU, với HBM4 vẫn là yếu tố bộ nhớ cốt lõi trong đóng gói GPU và giải phóng sức mạnh tính toán. Thông tin hiện tại không cho thấy việc giảm dung lượng HBM4 hoặc sản lượng GPU Rubin được điều chỉnh đồng thời. Trước đó, nhiều bên dự đoán vẫn coi HBM là một trong những thành phần khan hiếm nhất và có quyền định giá cao nhất trong máy chủ AI, với SK Hynix được thị trường xem là bên hưởng lợi chính.
Bạn có thể hiểu tủ AI như một máy chủ hiệu năng cao cực kỳ đắt tiền.
HBM gần với bộ nhớ tốc độ cao được gắn cạnh GPU, trong khi SOCAMM gần với bộ nhớ hệ thống có thể thay thế toàn bộ máy. Lần điều chỉnh này chủ yếu tập trung vào后者.
Đối với vị thế nắm giữ, sự khác biệt rất rõ ràng: nếu Micron có mức độ tiếp xúc lớn hơn trong giai đoạn SOCAMM, việc giảm giá trị đơn vị sẽ ảnh hưởng đến kỳ vọng của nó trước tiên; logic của SK Hynix về HBM tương đối độc lập, nhưng trong giao dịch quá đông đúc, nó cũng sẽ bị ảnh hưởng bởi tâm lý ngành.
Việc giảm cấu hình bộ nhớ hệ thống và suy diễn trực tiếp ra sự sụp đổ nhu cầu HBM4 vẫn chưa có đủ bằng chứng.
Cách phân chia hợp lý hơn là, quỹ lợi nhuận phía CPU thực sự đang đối mặt với áp lực điều chỉnh giảm, trong khi phía GPU vẫn cần theo dõi tổng lượng hàng xuất xưởng của Rubin và nhịp độ đơn hàng HBM4.
Tình hình bộ nhớ AI đã không còn có thể dùng một đường “tất cả bộ nhớ đều mạnh” để bao trùm tất cả các nhà cung cấp. Micron, SK Hynix và Samsung Electronics có mức độ tiếp xúc khác nhau với HBM, SoC RAM, DRAM truyền thống và NAND; các loại bộ nhớ khác nhau trong cùng một tủ máy cũng tương ứng với các mức giá, biên lợi nhuận và ràng buộc cung cầu khác nhau.
Giảm chi phí có thể mang lại nhiều tủ máy hơn không?
Giải thích lạc quan đến từ chi phí và nhịp độ giao hàng.
Theo tính toán của SemiAnalysis, chi phí tủ Rubin NVL72 có thể giảm từ khoảng 7,6 triệu USD xuống khoảng 6,8 triệu USD, giảm khoảng 800.000 USD.

Đối với các nhà cung cấp đám mây như Microsoft, Google, Amazon và Meta, các tủ AI không đơn thuần là mua phần cứng, mà là tính toán chi phí năng lực tính toán mỗi giờ, thời gian cung cấp và độ ổn định khi triển khai quy mô lớn.
Nếu giảm cấu hình giúp Rubin giao hàng nhanh hơn, sự giảm giá trị trên từng máy có thể được bù đắp bởi nhiều tủ máy hơn.
Logic is not complicated. If there is a shortage of high-capacity SOCAMM supply, NVIDIA choosing easier-to-deliver configurations can reduce the BOM per cabinet and minimize the risk of a single component delaying the entire unit's delivery.
Đối với người mua, nếu cấu hình bộ nhớ hệ thống thấp hơn không ảnh hưởng đáng kể đến các tải công việc cốt lõi, thì việc nhận tủ sớm có thể hấp dẫn hơn so với việc chờ phiên bản đầy đủ.
Vấn đề là bước này hiện vẫn chỉ là suy luận.
Chi phí giảm không tự động đồng nghĩa với việc đơn hàng tăng. Để bù đắp cho “giá trị trên mỗi thiết bị giảm” bằng “tổng số tủ máy tăng”, NVIDIA cần giao thêm nhiều Rubin NVL72, và các nhà cung cấp đám mây cũng cần đặt hàng thêm hoặc mua trước.
Hiện tại chưa có dữ liệu về đơn hàng công khai, hướng dẫn quý hoặc dữ liệu giao hàng thực tế để chứng minh điều này.
Để hiểu đơn giản, nếu dung lượng của một loại SOCAMM trong một tủ máy gần như giảm một nửa, thì tổng lượng xuất kho của tủ máy cần tăng rõ rệt để tổng nhu cầu Bit ở khâu này trở lại mức dự kiến ban đầu.

Ngay cả khi chi phí giảm khoảng 10%, cũng không thể khẳng định khách hàng sẽ mua đủ nhiều tủ máy chủ. Việc mua sắm của các nhà cung cấp đám mây lớn còn chịu ảnh hưởng bởi điện năng, xây dựng trung tâm dữ liệu, nguồn cung GPU, đóng gói tiên tiến và thiết bị mạng; sự giảm giá của một bảng BOM chỉ là một trong nhiều biến số.
HBM tình hình tương đối ổn định hơn, nhưng cũng không hoàn toàn miễn dịch.
Nếu lượng xuất kho của Rubin duy trì mạnh mẽ, HBM4 vẫn là một trong những khâu hưởng lợi trực tiếp nhất; nếu sau này chứng minh rằng việc giao hàng nguyên máy bị các nút thắt khác kéo chậm, HBM cũng sẽ chịu ảnh hưởng bởi nhịp độ xuất kho của nền tảng.
Sự khác biệt là báo cáo lần này không trực tiếp giảm mức cấu hình HBM4; thị trường đang chờ đợi số lượng tủ máy xuất xưởng tổng thể, chứ không chỉ tập trung vào con số dung lượng SOCAMM.
Dữ liệu bán ra mới là điểm định giá thực sự
Rủi ro lớn nhất hiện tại là thị trường trước tiên tái định giá dựa trên việc chia sẻ lợi nhuận, nhưng các dữ liệu sau đó lại không cung cấp sự hỗ trợ tích cực.
Nếu NVIDIA hoặc chuỗi cung ứng cuối cùng xác nhận Rubin NVL72 sẽ duy trì cấu hình SOCAMM thấp trong dài hạn, đồng thời tổng lượng giao hàng tủ không tăng đáng kể, các nhà cung cấp bộ nhớ hệ thống phía CPU sẽ đối mặt với sự thu hẹp kéo dài trong kỳ vọng doanh thu.
Đối với Micron, điều then chốt không chỉ là nhãn chung “AI memory beneficiary”, mà là sự phân bổ doanh thu của các sản phẩm khác nhau.
Trong các báo cáo tài chính và cuộc gọi phân tích tiếp theo, cần theo dõi xem ban quản lý có tiết lộ tốc độ tăng trưởng của DRAM, SOCAMM, HBM liên quan đến máy chủ AI hay không, cũng như lợi nhuận gộp có thay đổi do thông số kỹ thuật, giá cả hoặc thương lượng của khách hàng hay không.
Nếu công ty chỉ đưa ra những tuyên bố lạc quan về tổng nhu cầu nhưng không giải thích được ảnh hưởng của việc điều chỉnh cấu hình SOCAMM, thị trường có thể tiếp tục áp mức chiết khấu.
Đối với SK Hynix, điểm kiểm tra thiên về HBM.
Nếu tỷ lệ đơn hàng HBM4, nhịp độ xuất hàng và giá cả duy trì đà mạnh mẽ, đợt điều chỉnh này chỉ mang tính chất dao động tâm lý ngành; nếu sau đó tổng lượng xuất hàng của Rubin hoặc nhịp độ giao hàng HBM cũng bị điều chỉnh giảm, thị trường mới mở rộng tác động từ SOCAMM sang chuỗi HBM.
Đây cũng là sự thay đổi điển hình sau khi chủ đề AI memory đi đến giữa chừng.
Thị trường giai đoạn đầu mua theo hướng: các tủ AI được xây dựng ngày càng nhiều, bộ nhớ tiên tiến càng trở nên khan hiếm.
Hiện tại, tài sản cơ sở đã tích lũy mức tăng đáng kể, và vốn đang kiểm tra xem từng khoản lợi nhuận có thực sự được thực hiện hay không. Một chi tiết trong chuỗi cung ứng có thể kích hoạt biến động hàng ngày 7%-8%, cho thấy giao dịch trong ngành đã trở nên quá đông đúc, và các thông tin tiêu cực dễ dàng bị khuếch đại hơn.
Trước khi việc bán ra thực tế và việc phân tách báo cáo tài chính được thực hiện, việc định tính đợt điều chỉnh này là “tin xấu đã được phản ánh” hoặc “sụp đổ nhu cầu AI” vẫn còn quá sớm.
Quan điểm thận trọng hơn là công nhận áp lực giảm giá trị đơn vị trên phía CPU, đồng thời định giá riêng HBM4 và SOCAMM.
Tiếp theo, những yếu tố có khả năng thay đổi nhận định nhiều nhất vẫn là liệu NVIDIA có xác nhận BOM cuối cùng của Rubin NVL72, kế hoạch giao hàng thực tế của tủ Rubin có thể được điều chỉnh tăng hay không, cũng như mức độ phơi nhiễm doanh thu và biến động lợi nhuận gộp của Micron, SK Hynix và Samsung Electronics trong HBM và SOCAMM/LPDDR.
