Chi phí tăng của token AI khiến các công ty tập trung vào việc kiểm soát chi phí

icon币界网
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Theo BitJie, chi phí tăng của các token AI đang thúc đẩy các công ty ưu tiên kiểm soát chi phí. Mặc dù giá mỗi token đã giảm, nhưng tổng mức sử dụng đã tăng mạnh, với một số công ty tiêu hết ngân sách hàng năm ngay đầu năm 2026. Uber đã sử dụng hết ngân sách mã hóa AI của mình vào tháng Tư, và Microsoft đã hạn chế quyền truy cập vào Claude Code. Người đứng đầu doanh nghiệp của OpenAI cho biết khả năng minh bạch chi phí hiện là yếu tố then chốt. Quỹ Linux đang ra mắt Tokenomics Foundation để thiết lập các tiêu chuẩn chi phí. Các startup và công ty lớn đang phát triển các công cụ để theo dõi việc sử dụng token. Dữ liệu trên chuỗi cho thấy nhu cầu ngày càng tăng đối với các altcoin cần theo dõi trong thị trường đang thay đổi này.
Bijiewang báo cáo:

Sau khi các doanh nghiệp áp dụng rộng rãi các công cụ AI, các vấn đề mới bắt đầu nổi lên tập trung: không phải do mô hình không đủ mạnh, mà do hóa đơn tăng quá nhanh. Nhiều công ty công nghệ và internet phát hiện rằng, dù giá mỗi Token đã giảm, nhưng do sự phổ biến của AI trong lập trình, trợ lý tự động và các công cụ tác nhân, tổng lượng tiêu thụ vẫn đang tăng nhanh.

Nhiều công ty đã chi hết ngân sách trước thời hạn

TechCrunch báo cáo rằng một số công ty đã tiêu hết ngân sách AI trong năm 2026 ngay từ đầu. Uber đã sử dụng hết toàn bộ ngân sách mã hóa AI trong năm vào tháng 4; Microsoft đã thu hồi giấy phép sử dụng Claude Code của một số nhà phát triển sau khi mở rộng trong vài tháng; một nhân viên của Priceline cho biết mức giá gia hạn thông thường cho Cursor đã tăng lên 4 đến 5 lần so với trước đây.

Sự thay đổi này liên quan đến việc ra mắt các mô hình mạnh mẽ hơn trong vài tháng gần đây. Anthropic, OpenAI và Google đã lần lượt ra mắt các mô hình mới phù hợp hơn với các kịch bản tác nhân kể từ tháng 11 năm ngoái, thúc đẩy lượng gọi mô hình tiếp tục tăng mạnh. Một doanh nghiệp thậm chí đã phải đối mặt với hóa đơn Claude lên tới 500 triệu USD do không thiết lập giới hạn sử dụng cho nhân viên.

Năng suất tăng lên không nhất thiết bù đắp được chi phí

Alexander Embr, trưởng bộ phận doanh nghiệp của OpenAI, cho biết sáu tháng trước, khách hàng quan tâm nhiều hơn đến việc mô hình có đủ năng lực hay không, hiện tại trọng tâm thảo luận đã chuyển sang khả năng hiển thị chi phí, khả năng kiểm toán, kiểm soát Token và hiệu quả mô hình. Vấn đề doanh nghiệp mua AI đang chuyển từ “có thể làm gì” sang “đã chi bao nhiêu tiền, có đáng không”.

Các công ty trong ngành cũng bắt đầu tính toán lại tỷ lệ hoàn vốn của các công cụ mã hóa AI. Khảo sát của Faros AI đối với 20.000 nhà phát triển vào tháng 3 cho thấy năng suất phát triển đang tăng lên, nhưng số lượng lỗi và công việc phải làm lại cũng gia tăng. Nghiên cứu từ nền tảng quản lý kỹ thuật Jellyfish cho thấy các kỹ sư sử dụng AI mạnh mẽ có năng suất khoảng gấp đôi so với những người sử dụng ít, nhưng lượng token tiêu thụ lại cao hơn 10 lần.

  • Người dùng AI thường xuyên có năng suất cao gấp đôi so với người dùng ít sử dụng.
  • Token tương ứng tiêu tốn cao hơn khoảng 10 lần
  • Lượng tiêu thụ của một nhà phát triển đơn lẻ tăng khoảng 18,6 lần trong 9 tháng

Công cụ quản lý chi phí đang được thúc đẩy hình thành

Khi các vấn đề hóa đơn ngày càng mở rộng, thị trường các công cụ quản lý chi phí AI cũng bắt đầu sôi động. Tuần này, Linux Foundation tuyên bố thành lập Tokenomics Foundation, với mong muốn tạo ra một ngôn ngữ và tiêu chuẩn quản lý thống nhất cho chi phí AI Token, tương tự như FinOps trong lĩnh vực quản lý chi phí đám mây.

Tổ chức này có kế hoạch xây dựng các tiêu chuẩn mở về việc sử dụng và tính phí Token, các chỉ số thống nhất, cùng các thước đo mới liên quan đến hiệu quả chi phí, chẳng hạn như “chi phí thông minh trên mỗi đơn vị” hoặc “số Token trên mỗi watt”. Thời gian chính thức ra mắt dự kiến vào tháng 7 và sẽ công bố thêm các thành viên trong hội nghị FinOps X vào tuần tới.

Đồng thời, các công ty khởi nghiệp và các nhà sản xuất trưởng thành đều đang tăng tốc triển khai. Các công ty như Pay-i và Paid tập trung vào theo dõi, đo lường và tối ưu hóa chi phí AI; Jellyfish, Waydev và Faros AI cung cấp dịch vụ giám sát bằng AI agent; Ramp, Datadog và New Relic cũng đang bổ sung các tính năng quản lý chi phí AI, khả năng quan sát ở cấp độ Token và giám sát GPU.

Model routing trở thành hướng giảm chi phí

Một số nhà đầu tư và giám đốc doanh nghiệp cho rằng, những khả năng này trong tương lai sẽ xuất hiện nhiều hơn ở lớp ứng dụng hoặc lớp định tuyến mô hình. Ví dụ, công ty khởi nghiệp AI Factory tuần này đã ra mắt bộ định tuyến mô hình, tự động chọn mô hình phù hợp hơn dựa trên nhiệm vụ để giảm chi phí gọi mô hình. Một số hóa đơn doanh nghiệp cũng đã áp dụng cách làm tương tự, ngay cả khi gọi mô hình cao cấp, hệ thống vẫn phân bổ một phần yêu cầu cho các mô hình rẻ hơn để xử lý.

Thông tin bổ sung: Goldman Sachs dự kiến, đến năm 2030, lượng sử dụng token toàn cầu sẽ tăng 24 lần. Đối với các doanh nghiệp đã bước vào giai đoạn đầu tư cao, làm thế nào để kiểm soát chi phí đồng thời mở rộng việc sử dụng AI đang trở thành vấn đề thực tế trong giai đoạn triển khai tiếp theo.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.