Uber và Microsoft nhấn mạnh chi phí token AI đang tăng và lợi ích ngày càng giảm

iconTechFlow
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Uber và Microsoft đều đã cảnh báo về chi phí token AI tăng cao và lợi nhuận không rõ ràng trong các tin tức gần đây về AI + tiền điện tử. Ngân sách Claude Code của Uber đã hết sau bốn tháng, với các kỹ sư chi tới 2.000 USD mỗi tháng cho token. Microsoft đã giảm số giấy phép nội bộ do chi phí cao, trong khi GitHub chuyển Copilot sang mô hình trả tiền theo mức sử dụng. Dữ liệu từ Entelligence.AI cho thấy chỉ có 18 cent trên mỗi đô la chi tiêu cho token AI mang lại giá trị cho người dùng. Khi tin tức về việc ra mắt token ngày càng nhiều, các công ty đang chịu áp lực phải biện minh cho chi tiêu AI.

Bài viết: Bao Yilong

Nguồn: Wall Street Journal

Chi tiêu AI của doanh nghiệp đang bị thử thách nghiêm trọng, lượng Token tiêu thụ liên tục tăng cao, nhưng giá trị kinh doanh có thể định lượng lại khó tìm thấy.

Ngày 22 tháng 5, Giám đốc điều hành vận hành của Uber, công ty có vốn hóa thị trường vượt 200 tỷ USD, Andrew Macdonald, đã công khai tuyên bố trên một podcast rằng "vẫn chưa có đường nối nào giữa sự gia tăng tiêu thụ token và sự cải thiện thực chất của sản phẩm".

Macdonald chỉ ra rằng công ty ngày càng khó giải thích hợp lý cho các chi phí AI liên tục tăng cao. Ông thậm chí còn tạo ra một từ riêng để mô tả sự lãng phí trong nội bộ đội ngũ kỹ thuật: "tokenmaxxing" (tối đa hóa Token).

Vào giữa tháng 5 trước, Microsoft đã bắt đầu cắt giảm giấy phép sử dụng Claude Code nội bộ với lý do hóa đơn Token "không thể duy trì".

Hai sự kiện kết hợp lại khiến thị trường buộc phải chú ý đến một biến số trước đây bị bỏ qua. Kinh tế học token, tức là tính kinh tế theo đơn vị tiêu thụ token trong quy mô doanh nghiệp, đã từ một chủ đề thứ yếu trở thành cột trụ chính trong toàn bộ luận điểm đầu tư AI.

Năm bộ dữ liệu, tạo nên một bức tranh mới

Từ tháng 4, nhiều bộ dữ liệu đã lần lượt được công bố, cùng nhau vẽ nên một bức tranh đáng cảnh báo.

Tháng 4 năm nay, CTO của Uber công khai cho biết công ty đã tiêu hết toàn bộ ngân sách Claude Code trong năm chỉ trong bốn tháng.

Trong số 5.000 kỹ sư, tỷ lệ sử dụng hàng tháng dao động từ 84% đến 95%, hóa đơn trung bình hàng tháng mỗi người từ 150 USD đến 2.000 USD, và chính CTO này được báo cáo đã tiêu thụ các token trị giá 1.200 USD trong một buổi trình diễn nội bộ kéo dài hai giờ.

Macdonald mô tả rằng khi biết con số này, ông "sốc đến mức không thể nói nên lời".

Theo bản tin Notepad của Tom Warren thuộc The Verge, Claude Code đã nhanh chóng trở nên phổ biến trong cộng đồng kỹ sư nội bộ của Microsoft, nhưng mô hình tính phí dựa trên Token khiến chi phí quy mô trở nên không bền vững, do đó Microsoft ngay lập tức bắt đầu cắt giảm các giấy phép liên quan.

GitHub thông báo kể từ ngày 1 tháng 6, tất cả các kế hoạch Copilot sẽ chuyển từ mô hình đăng ký cố định sang mô hình tính phí theo mức sử dụng.

Bài viết thảo luận chính thức nhận gần 900 phiếu phản đối, do một số người dùng tính toán rằng một phiên lập trình tác nhân thường tiêu tốn 30 đến 40 đô la Mỹ, nghĩa là gói phí 10 đô la Mỹ mỗi tháng sẽ hết ngay trong một lần sử dụng.

Sau khi tổng hợp dữ liệu từ 2.444 doanh nghiệp, nền tảng năng suất nhà phát triển Entelligence.AI phát hiện:

  • Mỗi đô la chi cho phí AI Token chỉ tạo ra giá trị thực tế tiếp cận người dùng là 18 xu.
  • 44 cent Mỹ được sử dụng để sửa lỗi do AI tự sinh ra; 27 cent Mỹ chảy vào công việc làm lại; 11 cent Mỹ tiêu tốn do ma sát trong quá trình kiểm duyệt.

Theo Chỉ số Chi tiêu Token của Silicon Data LLM từ Bloomberg, giá token đã tăng khoảng 65% kể từ cuối tháng 2 năm nay, trong khi giá phần mềm AI của Mỹ tăng tích lũy từ 20% đến 37% trong năm qua.

Cuộc tranh chấp giữa người mua và người bán: Cùng một sự thật, hai cách diễn giải

Cùng một dữ liệu, nhưng trong các khung phân tích khác nhau có thể dẫn đến những kết luận hoàn toàn khác biệt.

Các nhà đầu tư tăng giá cho rằng tình trạng hỗn loạn hiện tại chỉ là giai đoạn đau đớn trong quá trình chuyển đổi thành công.

Theo phân tích của Jim Schneider từ Goldman Sachs vào đầu tháng 5, đến năm 2030, AI đại lý sẽ thúc đẩy lượng token tiêu thụ tăng 24 lần, đạt khoảng 120 tỷ tỷ token mỗi tháng, và biên lợi nhuận gộp của các nhà cung cấp dịch vụ đám mây quy mô lớn và nhà cung cấp mô hình sẽ chuyển sang dương trong vòng 3 đến 12 tháng tới.

Rich Privorotsky của Goldman Sachs cho rằng quý đầu tiên năm 2026 có thể đã là đỉnh điểm của “token maximization” như một KPI, khi ngành đang chuyển từ việc theo đuổi mức tiêu thụ sang một thước đo lành mạnh hơn là “chi phí trên mỗi hành động hiệu quả”.

Nghiên cứu kinh tế của JPMorgan cũng phát hiện rằng, đầu năm 2026, số lượng gói Python mới và được cập nhật trên PyPI đã tăng đột biến, trong khi xu hướng này không xuất hiện khi ChatGPT ra mắt năm 2022, cho thấy sự gia tăng năng suất thực sự đang diễn ra.

Ngoài ra, tỷ số P/E hiện tại của Mag 7 khoảng 20 lần lợi nhuận tương lai, thấp xa so với mức 52 lần vào đỉnh điểm bong bóng công nghệ năm 2000, 67 lần ở Nhật Bản năm 1989 và 34 lần trong thời kỳ “Nifty Fifty”. Theo các tiêu chuẩn đánh giá bong bóng trong quá khứ, hiện tại không tạo thành bong bóng.

Quan điểm ngắn hạn được nhà phân tích bán dẫn của Goldman Sachs, Jim Covello, trình bày một cách hệ thống nhất trong báo cáo tháng 4.

Anh ấy chỉ ra rằng gần như toàn bộ giá trị trong chuỗi cung ứng AI đều chảy đến các công ty bán dẫn, một hiện tượng chưa từng có trong lịch sử và không bền vững; các công ty chip lẽ ra nên hưởng lợi khi khách hàng được lợi, nhưng trong chu kỳ này, sự thịnh vượng của họ được đánh đổi bằng sự hao mòn của toàn bộ chuỗi cung ứng phía trên.

Lợi nhuận ròng của NVIDIA đã tăng khoảng 20 lần kể từ khi ChatGPT ra mắt; các nhà cung cấp dịch vụ đám mây quy mô lớn đã tiêu hết dòng tiền hoạt động và chuyển sang vay nợ—tổng khối lượng phát hành nợ liên quan đến trung tâm dữ liệu vào năm 2025 khoảng 182 tỷ USD, gấp đôi so với năm 2024.

Nghiên cứu của MIT Nanda cho thấy 95% doanh nghiệp đầu tư vào AI tạo sinh có lợi nhuận bằng không. Sự tách rời này có thể duy trì trong một thời gian, nhưng không thể kéo dài mãi mãi.

Nỗi lo ngại về cấu trúc tài trợ vòng lặp

Cuộc thảo luận này còn đề cập đến một cấp độ phức tạp hơn: vòng tuần hoàn tài chính giữa các nhà cung cấp dịch vụ điện toán đám mây quy mô lớn và các phòng thí nghiệm AI.

Theo các tài liệu tiết lộ do The Information tổng hợp, OpenAI và Anthropic chiếm hơn một nửa trong số khoảng 2 nghìn tỷ USD cam kết dịch vụ đám mây tương lai của Microsoft, Oracle, Google và Amazon. Cụ thể:

  • Trong số 627 tỷ USD đơn hàng tích lũy về dịch vụ đám mây của Microsoft, 280 tỷ USD được liên kết với OpenAI;
  • Trong tổng doanh thu tiềm năng 553 tỷ USD của Oracle, 54% (khoảng 300 tỷ USD) được OpenAI cam kết;
  • Trong 467,6 tỷ USD của Google, Anthropic chiếm 43% (khoảng 200 tỷ USD);
  • Mức độ phơi nhiễm của Amazon cũng đạt 51% so với khối lượng đơn hàng chưa thực hiện 464 tỷ USD.

Cơ cấu tài trợ này mang tính chất tuần hoàn nội tại. Khoản đầu tư 13 tỷ USD của Microsoft vào OpenAI chủ yếu được thực hiện dưới dạng điểm tích lũy Azure, mà OpenAI sử dụng để mua sức mạnh tính toán Azure, sau đó Microsoft ghi nhận chúng vào doanh thu đám mây.

Cùng một nhà cung cấp dịch vụ điện toán đám mây quy mô lớn, vừa là nhà đầu tư vốn cổ phần trong phòng thí nghiệm AI, vừa là nhà cung cấp dịch vụ thu hóa đơn năng lực tính toán.

Cấu trúc này cũng thể hiện trong dữ liệu lợi nhuận. Alphabet công bố lợi nhuận quý đầu tiên kỷ lục 62,6 tỷ USD, trong đó khoảng 28,7 tỷ USD, gần một nửa, đến từ sự tăng giá trên sổ sách từ cổ phần ở Anthropic.

Trong lợi nhuận quý đầu tiên 30,3 tỷ USD của Amazon, 16,8 tỷ USD là lợi nhuận chưa thực hiện trước thuế từ Anthropic, trong khi dòng tiền tự do giảm 95% xuống còn 1,2 tỷ USD do chi tiêu vốn cho trung tâm dữ liệu trong cùng kỳ đạt 44,2 tỷ USD.

Tính bền vững của hệ thống này phụ thuộc vào khả năng các phòng thí nghiệm AI tiếp tục nhận được tài trợ bên ngoài để thực hiện cam kết về điện toán đám mây, điều này lại dựa trên sự sẵn sàng liên tục thanh toán hóa đơn Token ngày càng tăng của các khách hàng doanh nghiệp.

Theo báo cáo, hiện tại Anthropic chi tới 3 USD cho mỗi 1 USD doanh thu. Khi nhịp độ huy động vốn chậm lại, độ tin cậy của dự báo doanh thu đám mây sẽ giảm xuống, và các bội số định giá của các nhà cung cấp đám mây quy mô lớn cũng sẽ chịu áp lực tái đánh giá.

Chuỗi này truyền dẫn hai chiều và cũng sẽ đứt gãy hai chiều.

Đây không phải năm 1999, nhưng vấn đề vẫn tồn tại

Hoàn cảnh hiện tại không tạo thành một kịch bản bong bóng điển hình.

Tính theo bội số định giá, bảy ông lớn công nghệ hiện đang giao dịch ở mức P/E tương lai khoảng 20 lần, thấp hơn nhiều so với mức 52 lần vào đỉnh điểm bong bóng công nghệ năm 2000, 67 lần vào năm 1989 tại thị trường Nhật Bản hoặc 34 lần trong thời kỳ “Nifty Fifty”.

Công nghệ AI bản thân nó là thực tế. Đối với nhóm người dùng nặng, dữ liệu về sự gia tăng năng suất cũng có thể xác minh được. Doanh thu hàng năm của OpenAI khoảng 20 tỷ USD, Anthropic khoảng 4,3 tỷ USD, hai phòng thí nghiệm này sẽ không biến mất.

Hiện nay, chi phí token (chi phí tính toán) đã trở thành yếu tố quyết định sự thành bại của AI, trong khi cách đây sáu tháng, mọi người thậm chí còn ít khi bàn đến chủ đề này.

Lúc đó, mọi người chỉ quan tâm đến “công nghệ có hiệu quả không”. Bây giờ câu trả lời rất rõ ràng: trong mắt những công việc và nhóm người cụ thể, công nghệ thực sự hiệu quả.

Nhưng vấn đề mới xuất hiện: Liệu những khoản tiền mà các doanh nghiệp hạ lưu tiết kiệm được nhờ AI có thể truyền tải kịp thời lên trên, vượt qua khung thời gian định giá mà thị trường vốn dành cho các phòng thí nghiệm AI và các ông lớn đám mây?

Những người lạc quan về AI cho rằng, miễn là công nghệ tiếp tục hoàn thiện, tỷ lệ hoàn vốn (ROI) của doanh nghiệp sẽ trở về dương trong vòng 1 đến 1,5 năm.

Những người bi quan cho rằng sẽ có thêm nhiều nhà quản lý cấp cao như McDonald công khai phàn nàn về tỷ lệ đầu tư - lợi nhuận thấp của AI và bắt đầu cắt giảm ngân sách.

Cả hai khả năng này đều có thể đang xảy ra, và kết quả vẫn chưa rõ ràng. Điều duy nhất có thể khẳng định là lời nói dối trước đây rằng “chỉ cần lượng tiêu thụ Token tăng lên là chứng tỏ chuyển đổi AI thành công” đã bị phá vỡ.

Việc tiêu tốn nhiều token không đồng nghĩa với việc có giá trị thương mại, hai bong bóng này cuối cùng sẽ bị vỡ. Hóa đơn của AI đã đến hạn, nhưng cuối cùng ai sẽ là người trả tiền? Hiện vẫn là một ẩn số.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.