Sau khi sử dụng AI, công ty dường như càng ngày càng nghèo h

Sau khi sử dụng AI, công ty dường như càng ngày càng nghèo hơn. Khi AI vừa ra đời, các giám đốc đều nghĩ rằng đây là cơ hội để cắt giảm nhân sự và giảm chi phí. Họ tưởng tượng rằng một AI có thể thay thế ba người, không ngủ không nghỉ, gọi là có ngay, không cần tăng lương, không cần bảo hiểm xã hội, và có thể hoạt động 24/7. Nghe thì hoàn hảo, nhưng thực tế là AI không lười biếng, cũng không làm thêm giờ — nó chỉ đơn giản là cứ làm thêm một chút thì lại thu thêm một chút tiền. Vì vậy, hiện nay nhiều công ty đã bắt đầu than thở: “Chúng tôi không đủ tiền để tiêu token.” Nhiều người nghe xong phản ứng đầu tiên là: “Chẳng đến nỗi nào chứ? AI chẳng phải ngày càng rẻ sao? Sau khi DeepSeek ra đời, chẳng phải ai cũng nói chi phí mô hình đã giảm mạnh sao?” Nhưng nhiều người đã bỏ qua một điều quan trọng: mô hình thì đã giảm giá, nhưng doanh nghiệp lại sử dụng ngày càng dữ dội hơn. Từ việc một người thỉnh thoảng dùng, đến toàn bộ nhân viên đều dùng, rồi đến hàng chục Agent chạy tự động 24/7 ở nền tảng sau — kết quả là mỗi lần gọi mô hình thì rẻ hơn, nhưng hóa đơn cuối tháng lại ngày càng đắt đỏ. Ví dụ, Uber cấp quyền truy cập Claude Code cho 5.000 kỹ sư, chỉ trong vài tháng đã gần như tiêu hết toàn bộ ngân sách AI cả năm. Microsoft gần đây cũng bắt đầu phanh lại, siết chặt quyền truy cập Claude Code trong nội bộ, không cho phép kỹ sư gọi mô hình tùy tiện nữa. Nói trắng ra, giai đoạn “muốn dùng thế nào thì dùng” đã kết thúc. Amazon còn trực tiếp hơn — họ gỡ luôn bảng xếp hạng sử dụng AI nội bộ. Lý do rất đơn giản: họ phát hiện ra rằng khi “số lượng AI đã dùng” trở thành chỉ số đánh giá, nhân viên sẽ bắt đầu cố tình tiêu tốn token để leo lên bảng xếp hạng. Nghe thì mọi người đều tích cực đón nhận AI, nhưng thực tế rất nhiều cuộc gọi không mang lại giá trị gì, chỉ đơn thuần là “dùng vì muốn dùng”. Trong một thí nghiệm đa Agent của miHoYo, hàng chục Agent chạy ở nền tảng sau, gọi qua gọi lại, chờ nhau, xác nhận nhau — bạn hỏi tôi một câu, tôi trả lời bạn, rồi bạn lại xác nhận lại tôi. Không ai kết thúc công việc, chuỗi gọi liên tục kéo dài. Cuối cùng, chỉ trong một đêm, họ đã tiêu tốn khoảng 2 triệu nhân dân tệ token, trong khi giá trị thực tế tạo ra gần như bằng không. Ở đây, nhiều người có thể thắc mắc: Token là gì? Vì sao nó có thể khiến một công ty phá sản? Thực ra, token có thể hiểu như “điện năng” trong thế giới AI. Bạn hỏi một câu trong khung chat, AI trả lời trong vài giây — trông như miễn phí. Nhưng ở nền tảng doanh nghiệp, mỗi lần bạn nhập một câu, mỗi lần AI tạo ra một đoạn văn bản, mỗi lần gọi mô hình, mỗi lần Agent thực hiện một công cụ — thậm chí mỗi lần AI nói chuyện với AI — đều tiêu tốn token. Điều quan trọng hơn là: logic thu phí của AI hoàn toàn khác với phần mềm truyền thống. Trước đây mua phần mềm, chi phí gần như cố định: một tài khoản bao nhiêu tiền, ngân sách năm bao nhiêu — đầu năm đã tính được chín phần mười. AI thì khác: nó tính theo lượng sử dụng, và lượng sử dụng này còn tăng lên theo độ phức tạp của quy trình kinh doanh. Một nhân viên thỉnh thoảng hỏi vài câu — chi phí không đáng kể; cả nhóm cùng dùng — chi phí bắt đầu tăng; khi tích hợp Agent để AI tự gọi AI — hóa đơn dễ dàng từ vài nghìn đồng nhảy vọt lên hàng chục triệu, thậm chí hàng trăm triệu. Đặc biệt trong hai năm qua, toàn xã hội đều khuyến khích mọi người dùng nhiều AI hơn nữa: tăng mức độ thâm nhập AI, tăng tần suất sử dụng, tăng mức độ tự động hóa — thậm chí có công ty còn đưa luôn lượng token tiêu thụ vào chỉ tiêu đánh giá hiệu suất. Trong kinh tế học có một quy luật rất kinh điển gọi là Định luật Goodhart: Khi một chỉ số trở thành mục tiêu, nó sẽ không còn là một chỉ số tốt nữa. Ở nước ngoài thậm chí còn tạo ra một từ mới: “Tokenmaxxing” — có thể hiểu là “đẩy token đến giới hạn tối đa”. Có người cho AI tối ưu cùng một đoạn code hàng chục lần; có người yêu cầu AI tạo ra hàng chục phiên bản báo cáo cùng lúc; có người cố tình chia một nhiệm vụ đơn giản thành hàng loạt Agent phối hợp — chỉ để hệ thống trông có vẻ “thông minh hơn”, khiến AI dần trở thành thứ trang trí vô nghĩa. Khi nhỏ lẻ thì còn chịu được, nhưng thực sự đẩy chi phí đến mức mất kiểm soát chính là các hệ thống đa Agent. Về lý thuyết, hệ thống này rất đẹp: một Agent phụ trách lập kế hoạch, một phụ trách thực thi, một phụ trách kiểm tra, một phụ trách tổng kết — giống như một đội nhóm kỹ thuật số. Nhưng thực tế vận hành lại giống như một cuộc họp dự án không có người chủ trì. Bạn hỏi tôi, tôi hỏi bạn; bạn chờ tôi, tôi chờ bạn; xác nhận một vòng chưa đủ thì lại xác nhận thêm vòng nữa. Mọi người đều đang hoạt động, nhưng công việc thì chẳng bao giờ kết thúc. Trong hầu hết hệ thống đa Agent, từ 30% đến 60% token thực chất bị tiêu hao vào những vòng lặp vô nghĩa này. Nói trắng ra: rất nhiều tiền không biến thành kết quả mà tan biến dần trong quá trình các AI “họp hành” với nhau. Hài hước hơn nữa là những Agent này không hề lười biếng — ngược lại, chúng quá nghiêm túc. Chúng tuân thủ chặt chẽ quy trình, thực thi từng bước logic một cách chính xác: Agent trước gọi Agent sau, Agent sau lại quay lại xác nhận Agent trước — cho đến khi toàn bộ hệ thống tự nhốt mình vào một cái bẫy vô tận. Giống như ở một số công ty, hàng chục người họp từ tối đến sáng hôm sau — ai cũng phát biểu, ai cũng hăng hái — nhưng chẳng ai ra quyết định, và cuộc họp vẫn tính phí theo giây. Vấn đề then chốt là: những “cuộc họp” này còn liên tục được nhân bản, chia nhỏ và lồng ghép lẫn nhau. Khi quy mô mở rộng, chi phí bắt đầu tăng theo cấp số nhân. Vì chi phí của AI không phải là chi phí một lần — mà sẽ liên tục được khuếch đại theo chuỗi gọi và gần như không thể dự đoán được. Lúc này mọi người không còn bàn về “AI có tốt không”, mà đang tính toán một điều thực tế hơn nhiều: Liệu thứ này có khiến hóa đơn của chúng ta nổ tung không? Các mô hình nội địa như DeepSeek hay DouBao đột nhiên được nhắc lại không phải vì tình cảm — mà vì một câu rất thực tế: Cùng một công việc nhưng giá có thể rẻ hơn vài lần. Nói trắng ra: đừng cứ việc gì cũng dùng mô hình đắt nhất. Việc đơn giản giao cho mô hình rẻ hơn; việc phức tạp mới dùng mô hình lớn. Doanh nghiệp bắt đầu hiểu rằng AI không phải công cụ “dùng càng nhiều càng giỏi” — mà là hệ thống “dùng càng nhiều càng tốn tiền”. Thị trường vốn cũng đổi màu: trước đây đánh giá công ty AI dựa trên ai gọi nhiều hơn, tăng trưởng nhanh hơn, tiêu token dữ dội hơn. Bây giờ chỉ nhìn duy nhất một thứ: ROI. Bạn tiêu quá nhiều token vậy có kiếm lại được tiền không? Một sự thật phũ phàng: Tăng hiệu suất thực sự không đồng nghĩa với kiếm tiền. Viết code nhanh gấp đôi nhưng sản phẩm chẳng bán thêm được đơn nào — đó chỉ là “tiêu tiền nhanh hơn”, chứ không phải kiếm tiền. Còn điều kỳ quặc hơn nữa là: chuyện này không chỉ xảy ra ở vài công ty riêng lẻ. Có công ty chỉ trong một tháng đã tiêu 5 tỷ USD trên Claude; từng xảy ra trường hợp quên đặt giới hạn nên token tăng vọt không kiểm soát. Meta còn kỳ lạ hơn — bên trong từng tổ chức bảng xếp hạng mang tên “Claudeonomics”, chuyên theo dõi ai dùng AI nhiều nhất. Người đứng đầu tháng đó tiêu hết 31.2 nghìn tỷ token. Đổi ra tiền mặt: số tiền đó đủ trả lương cho hai kỹ sư cấp cao làm việc cả năm. Nói cách khác: bên ngoài lãnh đạo hô hào “toàn bộ chuyển sang AI”, bên trong kế toán đã bắt đầu toát mồ hôi lạnh. Thực ra nói到底 (rốt cuộc), không phải là không dùng AI — mà là không còn tiêu token mù quáng nữa.Mọi người bắt đầu đặt ra một câu hỏi thực tế hơn: những token này, rốt cuộc có thể đổi thành tiền thật không? #AI #AIAgent @grok