Tác giả gốc: David Lopez Mateos
Bản dịch gốc: Shenchao TechFlow
Giới thiệu: Truyền thông thích dùng một con số để tóm tắt sự biến động giá của sức mạnh tính toán GPU, nhưng thực tế là: bốn nhà cung cấp chỉ số trên Bloomberg Terminal đưa ra mức giá chênh lệch hơn 2 USD so với nhau, với hướng đi và nhịp độ không đồng nhất. Tác giả bài viết này là David Lopez Mateos, người sáng lập nền tảng giao dịch sức mạnh tính toán GPU Compute Desk, người đã phân tích cấu trúc định giá thực tế của H100 và B200 bằng dữ liệu giao dịch thực tế, phơi bày một thị trường nguyên thủy—không có chuẩn tham chiếu, không có hợp đồng tiêu chuẩn, không có đường cong kỳ hạn—sức mạnh tính toán đang bị tích trữ và cho thuê lại như những căn hộ cho thuê ngắn hạn.
Tiêu đề truyền thông khiến bạn cảm thấy giá năng lực tính toán GPU đang tăng mạnh. Câu chuyện này rất dễ chịu, hoàn toàn phù hợp với khung vĩ mô “cung khan hiếm + nhu cầu AI không đáy” và ngụ ý một điều khiến bạn an tâm: chúng ta có một thị trường hoạt động tốt, tín hiệu giá rõ ràng và dễ đọc.
Nhưng chúng tôi không có. Câu chuyện này gần như hoàn toàn dựa trên một chỉ số duy nhất, gợi ý những điều không nên được gợi ý: thị trường cho thuê GPU đã hiệu quả đến mức có thể dùng một con số để đại diện cho trạng thái tổng thể.
Sự khan hiếm nguồn cung là có thật, nhưng cảm nhận về sự khan hiếm này hoàn toàn khác nhau giữa các cá nhân—phụ thuộc vào bạn là ai, bạn ở đâu, bạn giao dịch hợp đồng gì và tài sản tính toán nào. Trước sự thiếu minh bạch này, phản ứng tự nhiên của thị trường không phải là cơ chế định giá có trật tự, mà là tích trữ: khóa thời gian GPU mà bạn có thể chưa cần, vì bạn không chắc liệu chúng còn có thể mua được với bất kỳ giá nào vào tháng tới hay không. Nơi nào có tích trữ và không có chuẩn minh bạch, thị trường thứ cấp phân mảnh sẽ xuất hiện. Tại Compute Desk, chúng tôi đã hỗ trợ các thuê bao chuyển nhượng lại cụm máy của họ giống như việc cho thuê lại căn hộ trong các sự kiện lớn. Đây không phải là giả định—điều này đang diễn ra thực tế.
Chỉ số không hội tụ
Trong các thị trường hàng hóa trưởng thành, các chỉ số được xây dựng dựa trên các phương pháp luận khác nhau sẽ có xu hướng hội tụ. Dầu Brent và WTI có chênh lệch giá vài đô la do vị trí địa lý và chất lượng dầu thô, nhưng chúng di chuyển cùng hướng (Hình 1). Sự hội tụ này là dấu hiệu của một thị trường hiệu quả.

Chú thích: So sánh diễn biến giá dầu Brent và WTI, xu hướng hoàn toàn đồng hướng
Hiện tại, trên màn hình Bloomberg có ba nhà cung cấp chỉ số định giá GPU: Silicon Data, Ornn AI và Compute Desk. SemiAnalysis vừa công bố nhà cung cấp thứ tư — một chỉ số giá hợp đồng một năm cho H100 được xây dựng dựa trên dữ liệu khảo sát từ hơn 100 người tham gia thị trường. Silicon Data và Ornn công bố chỉ số thuê H100 hàng ngày, Compute Desk tổng hợp dữ liệu ở cấp độ kiến trúc Hopper, trong khi SemiAnalysis ghi nhận giá hợp đồng sau khi đàm phán, chứ không phải giá niêm yết hay giá thu thập bằng web scraping. Phương pháp luận khác nhau, tần suất khác nhau và góc nhìn về cùng một thị trường cũng khác biệt. Khi đặt chúng cạnh nhau, sự khác biệt trở nên rõ ràng (Hình 2).

Chú thích: So sánh chồng lấn của bốn chỉ số GPU, mức giá và xu hướng đều rõ ràng khác biệt
Sự tăng giá thực sự xảy ra ở đâu
Sử dụng dữ liệu Compute Desk, chúng ta có thể phân tích biến động giá H100 theo loại nhà cung cấp và cấu trúc hợp đồng, đồng thời chồng lên chỉ số SDH100RT của Silicon Data (Hình 3). Tất cả các chỉ số đều cho thấy giá đang tăng, nhưng điểm khởi đầu và mức độ tăng khác nhau đáng kể tùy theo chỉ số và loại hợp đồng.

Chú thích: Biểu đồ giá theo loại hợp đồng của H100 được xếp chồng lên chỉ số SDH100RT
Dữ liệu neocloud H100 của Compute Desk kể một câu chuyện chi tiết hơn so với chỉ số tổng hợp. Giá theo nhu cầu tương đối ổn định trong suốt mùa đông, khoảng 3,00 USD/giờ, sau đó tăng mạnh vào tháng 3 lên 3,50 USD. Giá spot thì biến động nhiều hơn và thấp hơn, cho đến tháng 3 mới có xu hướng tăng nhẹ. Trong khi đó, SDH100RT của Silicon Data cho thấy sự tăng trưởng ổn định và mượt mà hơn, tăng từ 2,00 USD lên 2,64 USD trong cùng giai đoạn. Hai chỉ số này liên tục ở mức giá khác nhau và mô tả nhịp độ thời gian khác nhau: Compute Desk nói về sự nhảy vọt vào tháng 3, còn Silicon Data nói về sự tăng dần chậm rãi.
Giá dự trữ một năm cơ bản ổn định cho đến trước tháng Hai, sau đó tăng đột ngột từ 1,90 USD lên 2,64 USD vào cuối tháng Ba—không phải là sự theo kịp dần dần, mà là một lần định giá lại đột ngột. Điều này giống như các nhà cung cấp điều chỉnh giá hợp đồng tập trung sau khi thị trường theo nhu cầu thắt chặt, thay vì do nhu cầu cấu trúc bền vững.
Câu chuyện tháng 3 của B200 còn mạnh mẽ hơn (Hình 4). Chỉ số theo nhu cầu của Compute Desk đã tăng vọt từ 5,70 USD lên hơn 8,00 USD trong vài tuần. SDB200RT của Silicon Data tăng từ 4,40 USD lên 6,11 USD trước khi giảm xuống còn 5,47 USD. Cả hai chỉ số đều ghi nhận đợt biến động này, nhưng điểm khởi đầu chênh lệch hơn 2 USD và hình thái tăng giảm cũng khác nhau. B200 chỉ có dữ liệu chưa đầy năm tháng, ít nhà cung cấp hơn và chênh lệch giá lớn hơn; hai chỉ số này đang quan sát cùng một sự kiện qua những thấu kính hoàn toàn khác biệt.

Chú thích: Biểu đồ giá theo yêu cầu và giá đặt trước của B200, với dữ liệu từ Compute Desk và Silicon Data được chồng lên
Vấn đề hạ tầng, không chỉ là sự khác biệt về địa lý
Thị trường hàng hóa có chênh lệch cơ sở (basis differential). Khí tự nhiên Appalachia là ví dụ kinh điển: lượng dự trữ khổng lồ nằm trên năng lực đường ống bị hạn chế về cấu trúc, tỷ lệ sử dụng của hành lang Pennsylvania-Ohio thường vượt quá 100%, và các dự án mới như Borealis Pipeline sẽ không đi vào hoạt động cho đến cuối những năm 2020.
Thị trường GPU cũng có tình huống tương tự: một card H100 ở Virginia và một card H100 ở Frankfurt không phải là cùng một loại hàng hóa kinh tế. Nhưng sự khác biệt về địa lý đơn thuần không thể giải thích tại sao chỉ số đo lường trên cùng một thị trường lại có sự chênh lệch lớn đến vậy. Sự bất cập trong thị trường GPU còn sâu sắc hơn cả khí đốt Appalachia. Vấn đề của khí đốt là một điểm yếu duy nhất: năng lực đường ống kết nối giữa cung và cầu. Khoảng trống hạ tầng trong thị trường tính toán tồn tại ở cả hai phía cung và cầu. Hạ tầng vật lý—mạng lưới đồng nhất, cấu hình có thể dự đoán được, khả năng sẵn có có thể dự đoán được—cần thiết để phân phối tính toán một cách đáng tin cậy—vẫn chưa phát triển đầy đủ, đôi khi hoàn toàn không hoạt động. Hạ tầng tài chính—các hợp đồng chuẩn hóa, chuẩn minh bạch, cơ chế arbitrage có thể thu hẹp chênh lệch giá dù tồn tại sự khác biệt về mặt vật lý—cũng chưa tồn tại.
Dữ liệu kể một câu chuyện. Trải nghiệm thực tế khi cố gắng mua công suất tính toán vào đầu năm 2026 kể một câu chuyện còn đau hơn. Nhu cầu sử dụng theo yêu cầu của tất cả các loại GPU đều đã hết sạch. Việc tìm 64 chiếc H100 cũng rất khó khăn: Compute Desk cho thấy 90% nhà cung cấp có lượng sẵn có trong cụm theo yêu cầu bằng không, thị trường đặt trước cũng chẳng khá hơn là bao. Trong một thị trường hoạt động tốt, mức độ khan hiếm này đã sớm đẩy giá lên mức cân bằng mới. Nhưng thực tế thì không. Điều này cho thấy chính các nhà cung cấp cũng thiếu thông tin định giá thời gian thực để điều chỉnh. Giá đang tăng, nhưng tăng quá chậm, không đủ để thanh lý thị trường. Khoảng cách giữa giá niêm yết và ý định thanh toán thực tế đang được lấp đầy bởi việc tích trữ, cho thuê lại và các giao dịch phi chính thức trên thị trường thứ cấp.
Cần thay đổi gì
Hiện tại, thị trường sức mạnh tính toán GPU đang gặp bảy vấn đề cốt lõi:
Không có tiêu chuẩn đồng thuận. Nhiều chỉ số cùng tồn tại, phương pháp luận khác nhau và kết luận mâu thuẫn lẫn nhau.
Câu chuyện tổng hợp che giấu cấu trúc. Một con số “giá H100” che giấu sự khác biệt lớn giữa các loại nhà cung cấp và kỳ hạn hợp đồng.
Thiếu dữ liệu cấp giao dịch. Trên thị trường hai chiều, sự chênh lệch giữa giá niêm yết và giá giao dịch thực tế rất lớn.
Không có hợp đồng chuẩn hóa. Hầu hết các hợp đồng thuê GPU đều được đàm phán song phương với các điều khoản khác nhau. Các kỳ hạn hợp đồng ngắn hơn và chuẩn hóa hơn sẽ cải thiện thanh khoản và phát hiện giá.
Chất lượng giao hàng không được đảm bảo. Kiến trúc kết nối, cặp CPU, ngăn mạng và thời gian chạy khác nhau rất nhiều. Người mua cần biết rõ chất lượng của sức mạnh tính toán họ đang mua trước khi đưa ra cam kết.
Hợp đồng không có thanh khoản. Nếu nhu cầu thay đổi trong thời gian đặt trước, các lựa chọn rất hạn chế: hoặc chấp nhận chi phí, hoặc cho thuê lại không chính thức. Thị trường cần cơ sở hạ tầng cho phép chuyển nhượng hoặc bán lại công suất đã cam kết, để năng lực sản xuất có thể hướng đến những người cần nó nhất.
Không có đường cong kỳ hạn. Không thể định giá kỳ hạn, nên không thể phòng ngừa rủi ro. Đó là lý do tại sao các bên cho vay áp dụng chiết khấu 40%-50% đối với tài sản thế chấp GPU, khiến chi phí tài trợ ở mức cao.
Không thể chỉ dựa vào một yếu tố duy nhất để xây dựng một thị trường hoạt động hiệu quả cho mặt hàng quan trọng nhất của thế kỷ này. Đo lường, chuẩn hóa, cấu trúc hợp đồng, chất lượng giao hàng, thanh khoản—tất cả những yếu tố này phải tiến triển đồng bộ; trước khi đó, không ai có thể xác định chính xác một giờ GPU trị giá bao nhiêu.
