Sau khi các doanh nghiệp áp dụng rộng rãi các công cụ AI, các vấn đề mới bắt đầu nổi lên tập trung: không phải do mô hình không đủ mạnh, mà do hóa đơn tăng quá nhanh. Nhiều công ty công nghệ và internet phát hiện rằng, dù giá mỗi Token đã giảm, nhưng do sự phổ biến của AI trong lập trình, trợ lý tự động và các công cụ tác nhân, tổng lượng tiêu thụ vẫn đang tăng nhanh.
Nhiều công ty đã chi hết ngân sách trước thời hạn
TechCrunch báo cáo rằng một số công ty đã tiêu hết ngân sách AI trong năm 2026 ngay từ đầu. Uber đã sử dụng hết toàn bộ ngân sách mã hóa AI trong năm vào tháng 4; Microsoft đã thu hồi giấy phép sử dụng Claude Code của một số nhà phát triển sau khi mở rộng trong vài tháng; một nhân viên của Priceline cho biết mức giá gia hạn thông thường cho Cursor đã tăng lên 4 đến 5 lần so với trước đây.
Sự thay đổi này liên quan đến việc ra mắt các mô hình mạnh mẽ hơn trong vài tháng gần đây. Anthropic, OpenAI và Google đã lần lượt ra mắt các mô hình mới phù hợp hơn với các kịch bản tác nhân kể từ tháng 11 năm ngoái, thúc đẩy lượng gọi mô hình tiếp tục tăng mạnh. Một doanh nghiệp thậm chí đã phải đối mặt với hóa đơn Claude lên tới 500 triệu USD do không thiết lập giới hạn sử dụng cho nhân viên.
Năng suất tăng lên không nhất thiết bù đắp được chi phí
Alexander Embr, trưởng bộ phận doanh nghiệp của OpenAI, cho biết sáu tháng trước, khách hàng quan tâm nhiều hơn đến việc mô hình có đủ năng lực hay không, hiện tại trọng tâm thảo luận đã chuyển sang khả năng hiển thị chi phí, khả năng kiểm toán, kiểm soát Token và hiệu quả mô hình. Vấn đề doanh nghiệp mua AI đang chuyển từ “có thể làm gì” sang “đã chi bao nhiêu tiền, có đáng không”.
Các công ty trong ngành cũng bắt đầu tính toán lại tỷ lệ hoàn vốn của các công cụ mã hóa AI. Khảo sát của Faros AI đối với 20.000 nhà phát triển vào tháng 3 cho thấy năng suất phát triển đang tăng lên, nhưng số lượng lỗi và công việc phải làm lại cũng gia tăng. Nghiên cứu từ nền tảng quản lý kỹ thuật Jellyfish cho thấy các kỹ sư sử dụng AI mạnh mẽ có năng suất khoảng gấp đôi so với những người sử dụng ít, nhưng lượng token tiêu thụ lại cao hơn 10 lần.
- Người dùng AI thường xuyên có năng suất cao gấp đôi so với người dùng ít sử dụng.
- Token tương ứng tiêu tốn cao hơn khoảng 10 lần
- Lượng tiêu thụ của một nhà phát triển đơn lẻ tăng khoảng 18,6 lần trong 9 tháng
Công cụ quản lý chi phí đang được thúc đẩy hình thành
Khi các vấn đề hóa đơn ngày càng mở rộng, thị trường các công cụ quản lý chi phí AI cũng bắt đầu sôi động. Tuần này, Linux Foundation tuyên bố thành lập Tokenomics Foundation, với mong muốn tạo ra một ngôn ngữ và tiêu chuẩn quản lý thống nhất cho chi phí AI Token, tương tự như FinOps trong lĩnh vực quản lý chi phí đám mây.
Tổ chức này có kế hoạch xây dựng các tiêu chuẩn mở về việc sử dụng và tính phí Token, các chỉ số thống nhất, cùng các thước đo mới liên quan đến hiệu quả chi phí, chẳng hạn như “chi phí thông minh trên mỗi đơn vị” hoặc “số Token trên mỗi watt”. Thời gian chính thức ra mắt dự kiến vào tháng 7 và sẽ công bố thêm các thành viên trong hội nghị FinOps X vào tuần tới.
Đồng thời, các công ty khởi nghiệp và các nhà sản xuất trưởng thành đều đang tăng tốc triển khai. Các công ty như Pay-i và Paid tập trung vào theo dõi, đo lường và tối ưu hóa chi phí AI; Jellyfish, Waydev và Faros AI cung cấp dịch vụ giám sát bằng AI agent; Ramp, Datadog và New Relic cũng đang bổ sung các tính năng quản lý chi phí AI, khả năng quan sát ở cấp độ Token và giám sát GPU.
Model routing trở thành hướng giảm chi phí
Một số nhà đầu tư và giám đốc doanh nghiệp cho rằng, những khả năng này trong tương lai sẽ xuất hiện nhiều hơn ở lớp ứng dụng hoặc lớp định tuyến mô hình. Ví dụ, công ty khởi nghiệp AI Factory tuần này đã ra mắt bộ định tuyến mô hình, tự động chọn mô hình phù hợp hơn dựa trên nhiệm vụ để giảm chi phí gọi mô hình. Một số hóa đơn doanh nghiệp cũng đã áp dụng cách làm tương tự, ngay cả khi gọi mô hình cao cấp, hệ thống vẫn phân bổ một phần yêu cầu cho các mô hình rẻ hơn để xử lý.
Thông tin bổ sung: Goldman Sachs dự kiến, đến năm 2030, lượng sử dụng token toàn cầu sẽ tăng 24 lần. Đối với các doanh nghiệp đã bước vào giai đoạn đầu tư cao, làm thế nào để kiểm soát chi phí đồng thời mở rộng việc sử dụng AI đang trở thành vấn đề thực tế trong giai đoạn triển khai tiếp theo.
