GitHub thông báo tạm dừng nhận đăng ký mới cho phiên bản cá nhân của Copilot để ứng phó với áp lực tính toán do các luồng làm việc của đại lý AI gây ra. Phó chủ tịch sản phẩm Joe Binder cho biết, các đại lý AI yêu cầu tính toán liên tục với lưu lượng cao, vượt xa khả năng thiết kế ban đầu của hệ thống. Để đảm bảo ổn định dịch vụ cho người dùng hiện tại, GitHub đã áp dụng giới hạn người dùng mới, đồng thời triển khai giới hạn phiên và hạn mức token hàng tuần, dần chuyển sang mô hình tính phí dựa trên lượng token tiêu thụ, đồng thời loại bỏ hoặc tăng chi phí sử dụng một số mô hình cao cấp. Hiện tượng này phản ánh tình trạng khan hiếm tài nguyên phổ biến trong cơ sở hạ tầng AI hiện nay, khi Anthropic, Google, OpenAI và các nhà cung cấp đám mây AWS, Azure đều áp dụng các biện pháp hạn chế tương tự, làm nổi bật mâu thuẫn cấu trúc giữa việc triển khai quy mô lớn các mô hình lớn và nguồn cung năng lực tính toán hạ tầng.
Tác giả bài viết, nguồn: AIBase
Do áp lực lên tài nguyên tính toán trí tuệ nhân tạo chưa từng có, GitHub thuộc Microsoft chính thức thông báo ngừng chấp nhận các đăng ký cá nhân mới cho Copilot. Nền tảng lưu trữ mã lớn nhất thế giới đang rơi vào cuộc đấu tranh giữa ngân sách và cam kết dịch vụ.
Joe Binder, Phó chủ tịch sản phẩm của GitHub, cho biết các luồng công việc được điều khiển bởi đại lý AI đã thay đổi hoàn toàn nhu cầu tính toán. Những “đại lý” có khả năng tự thực hiện các nhiệm vụ phức tạp này thường yêu cầu hỗ trợ tính toán kéo dài và đồng thời cao, mức tiêu thụ tài nguyên của chúng vượt xa dự kiến ban đầu.
Khoảng trống công suất tính toán gây suy giảm dịch vụ
Để duy trì sự ổn định dịch vụ cho người dùng hiện tại, chính thức buộc phải thực hiện các biện pháp hạn chế. Nếu không giới hạn sự tăng trưởng của người dùng mới, tất cả các nhà phát triển đều đối mặt với nguy cơ chất lượng dịch vụ giảm mạnh.
Thực tế, tình trạng thiếu hụt năng lực tính toán này đã trở thành vấn đề phổ biến trong ngành, với các công ty lớn như Anthropic, Google và OpenAI đều đã siết chặt các hạn chế sử dụng. Các nhà cung cấp dịch vụ đám mây cũng đang gặp khó khăn, ngay cả những cái tên mạnh như AWS và Azure gần đây cũng liên tục đối mặt với giới hạn công suất.
Chuyển đổi mô hình tính phí và điều chỉnh quyền lợi
Để đối phó với chi phí vận hành cao, GitHub đã bắt đầu điều chỉnh các quy tắc sử dụng, áp dụng các hạn chế phiên nghiêm ngặt hơn và giới hạn token hàng tuần. Điều này có nghĩa là các nhà phát triển phải chờ đến khi khung thời gian được đặt lại mới có thể tiếp tục sử dụng sau khi đạt đến mức tiêu thụ tối đa.
Ngoài ra, kế hoạch chính thức là từng bước loại bỏ mô hình phí cố định và chuyển sang mô hình tính phí dựa trên lượng token tiêu thụ. Là một phần của kế hoạch cắt giảm chi phí, một số mô hình cao cấp đắt tiền đã bị loại khỏi phạm vi đăng ký hoặc được tính phí với tỷ lệ cao hơn.
