Ngành công nghiệp AI sắp đạt đến một điểm ngoặt. Theo Epoch AI, một tổ chức phi lợi nhuận theo dõi các xu hướng trí tuệ nhân tạo, sức mạnh tính toán dành riêng để chạy các mô hình AI sẽ tăng trưởng nhanh hơn sức mạnh tính toán được sử dụng để xây dựng chúng vào năm 2030.
Các con số đằng sau sự thay đổi
Các dự báo của Epoch AI cho thấy một ngành công nghiệp nơi kinh tế của việc triển khai ngày càng chi phối kinh tế của phát triển. Tổ chức này ước tính rằng gần một nửa tổng lượng tính toán suy luận sẽ chuyển sang ASIC, hay Mạch tích hợp chuyên dụng, vào cuối thập kỷ này. Đây là các chip được thiết kế để thực hiện một nhiệm vụ duy nhất một cách cực kỳ hiệu quả, thay vì các GPU đa năng hiện đang vận hành phần lớn các tác vụ AI.
Trong khi đó, tỷ lệ tính toán đào tạo trong tổng các hoạt động AI dự kiến sẽ duy trì ở mức khoảng 5%. Tính toán đào tạo cho các mô hình AI tiên tiến hiện đang tăng trưởng với tốc độ hàng năm từ 4 đến 5 lần. Tổng cơ sở tính toán AI được lắp đặt đang mở rộng với tốc độ tương tự.
Trong lịch sử, việc suy luận đã chiếm 60% đến 80% tính toán trong các triển khai thực tế.
Đến năm 2030, các đợt đào tạo frontier dự kiến sẽ đạt khoảng 2e29 FLOP. Sự tiến bộ này tương đương với bước nhảy từ GPT-2 đến GPT-4, được hỗ trợ bởi các nguồn lực có chi phí vượt quá 100 tỷ USD. Mỗi đợt đào tạo frontier đó có thể yêu cầu từ 4 đến 16 gigawatt công suất tính toán.
Tổng công suất AI của các dự án Epoch AI tại Mỹ có thể vượt quá 50 GW vào năm 2030, với công suất toàn cầu vượt quá 100 GW.
Tại sao ASICs đang ăn dần inference
Google đã phát hiện ra điều này cách đây nhiều năm với các đơn vị xử lý Tensor của mình. Amazon có các chip Inferentia của mình. Xu hướng mà Epoch AI dự báo cho thấy đây không phải là chiến lược nhỏ lẻ, mà là hướng đi mà khoảng một nửa thị trường suy luận sẽ theo vào cuối thập kỷ.
Các ràng buộc đối với lộ trình tăng trưởng này không hề nhỏ. Nhu cầu điện năng, năng lực sản xuất chip và giới hạn truyền dữ liệu đều đặt ra những thách thức thực tế. Đánh giá của Epoch AI cho rằng những điểm nghẽn này có thể kiểm soát được dưới các giả định tăng trưởng hiện tại.
Điều này có nghĩa gì đối với các nhà đầu tư
Nếu tính toán suy luận là nơi hướng phát triển của sự tăng trưởng, thì luận điểm đầu tư cho ngành bán dẫn sẽ thay đổi đáng kể. Việc huấn luyện vẫn đòi hỏi GPU và ngân sách huấn luyện vẫn đang tăng trưởng 4 đến 5 lần mỗi năm. Nhưng cơ hội doanh thu lặp lại với khối lượng cao hơn ngày càng tập trung vào suy luận.
Khi bạn nói đến 50 GW công suất AI chỉ riêng tại Hoa Kỳ, đó là một sự mở rộng quy mô khổng lồ các trung tâm dữ liệu, hệ thống phát điện và hệ thống làm mát.
Rủi ro cần theo dõi là liệu tốc độ tăng trưởng hàng năm 4 đến 5 lần trong khả năng tính toán có bền vững hay không. Các dự báo của Epoch AI giả định các xu hướng hiện tại sẽ tiếp tục, nhưng các ràng buộc về năng lượng và động lực nguồn cung chip địa chính trị đều có thể gây ra trở ngại.
