OpenAI và Broadcom hợp tác phát triển bộ tăng tốc AI được tối ưu hóa cho mô hình ngôn ngữ lớn với công suất 10 gigawatt

OpenAI đã kết thúc việc thuê tương lai từ Nvidia. Công ty đã công bố hợp tác với Broadcom để phát triển các bộ tăng tốc AI tùy chỉnh được tối ưu hóa đặc biệt cho các mô hình ngôn ngữ lớn, với mục tiêu triển khai kéo dài từ nửa sau năm 2026 đến cuối năm 2029.

Quy mô thật đáng kinh ngạc: 10 gigawatt bộ tăng tốc AI tùy chỉnh.

Hợp tác thực sự trông như thế nào

Sự phân công lao động ở đây rất rõ ràng. OpenAI phụ trách thiết kế bộ tăng tốc, mang hiểu biết sâu sắc về các tải công việc LLM trực tiếp vào kiến trúc silicon. Broadcom chịu trách nhiệm phát triển, sản xuất và triển khai các hệ thống đó, tích hợp chúng với công nghệ mạng Ethernet của chính họ.

Quảng cáo

Đây không phải là lần đầu tiên OpenAI quan tâm đến các con chip tùy chỉnh. Các báo cáo xuất hiện vào tháng 9 năm 2025 cho biết công ty đang hợp tác với Broadcom để phát triển chip bộ tăng tốc “XPU” dự kiến sản xuất vào năm 2026. Thông báo ngày 13 tháng 10 đã xác nhận và mở rộng đáng kể nỗ lực này.

“Việc phát triển các bộ tăng tốc của riêng chúng tôi góp phần vào hệ sinh thái rộng lớn hơn,” CEO OpenAI Sam Altman cho biết.

CEO của Broadcom, Hock Tan, đã diễn đạt rõ ràng hơn tham vọng này, mô tả mục tiêu là “cùng phát triển và triển khai 10 gigawatt bộ tăng tốc thế hệ tiếp theo.”

Việc cài đặt sẽ được triển khai tại các cơ sở của chính OpenAI và các trung tâm dữ liệu liên kết.

Tại sao OpenAI cần chip riêng của mình

Theo báo cáo, OpenAI có hơn 800 triệu người dùng hoạt động hàng tuần sử dụng các dịch vụ AI dựa trên đám mây của họ. Việc chạy các mô hình ngôn ngữ lớn ở quy mô này cực kỳ tốn kém, và các bộ tăng tốc tùy chỉnh cho phép OpenAI tích hợp trực tiếp các hiểu biết kiến trúc vào phần cứng—thay vì viết phần mềm để khắc phục hạn chế của chip, bạn thiết kế chip dựa trên chính xác nhu cầu của phần mềm.

Đây là cùng một kế hoạch mà Google đã thực hiện với các chip TPU (Tensor Processing Unit). Amazon đã làm theo với các chip Trainium và Inferentia cho AWS. Microsoft có các bộ tăng tốc Maia của mình.

Điều này có nghĩa gì đối với cảnh quan cạnh tranh

Việc tích hợp mạng Ethernet của Broadcom là một chi tiết quan trọng. Suy luận AI quy mô lớn không chỉ đơn thuần là về các chip nhanh — mà còn là về việc di chuyển dữ liệu giữa các chip một cách hiệu quả. Bằng cách kết hợp chuyên môn mạng của mình với thiết kế bộ tăng tốc của OpenAI, Broadcom có thể cung cấp giải pháp toàn diện.

Mốc thời gian triển khai 2026-2029 có ý nghĩa quan trọng đối với bất kỳ ai mô hình hóa tài chính của OpenAI. Các chip tùy chỉnh cần thời gian để mang lại lợi nhuận, nhưng một khi hoạt động, chúng có thể giảm đáng kể chi phí tính toán trên mỗi truy vấn của OpenAI. Với 800 triệu người dùng hoạt động hàng tuần và đang tăng trưởng, ngay cả những cải thiện hiệu suất khiêm tốn trên mỗi lần suy luận cũng có thể mang lại tiết kiệm lên tới hàng tỷ đô la mỗi năm.