Isang startup na may apat na miyembro na tinatawag na Swan AI ay nagbabayad ng $113,000 kada buwan para sa AI. Apat na tao, six figures sa monthly compute bills. Iyon ay hindi isang problema sa pagpapatakbo ng tauhan. Iyon ay isang problema sa presyo.
Sa gitna ng 2026, naging sobrang mahirap ang ekonomiks ng pagpapatakbo ng AI workloads kaya ang mga kumpanya ng lahat ng laki ay gumagawa ng isang bagay na talagang ayaw ng mga malalaking provider ng model: ang paghahanap ng pinakamababang presyo sa real time. Ngayon, dinamikong pinapadala ng mga negosyo ang mga query sa iba’t ibang AI models, at pinipili ang pinakamura na opsyon na makakapag-handle sa bawat partikular na gawain.
Ang krisis sa budget na walang sinadyang magkaroon
Ang mga numero ay nagkukuwento ng isang kuwento na dapat gumawa ng hindi komportable ang anumang CFO. Ang mga pag-invest sa AI ng korporasyon ay umabot sa $252.3B noong 2024, isang nakakagulat na halaga na nagpapahiwatig na ang industriya ay nagtatala ng malaking taya sa mga mapagbabago回报. Ang problema? Ang karamihan sa mga kumpanya na nag-aadopt ng AI ay nagsasalaysay ng savings sa gastos na mas mababa sa 10%.
At ang operasyonal na gawain ay mas masama pa. Ipinakita ng CTO ng Uber na ang buong budget ng kumpanya para sa AI noong 2026 ay nalunasan na sa ikalawang quarter. Hindi isang bahagyang labis, hindi isang maliit na pagkakamali. Ang buong budget, nawala bago ang tag-init.
Ang $113,000 na monthly na gastos ni Swan AI ay lalong nakakatangi sa kabuuang laki ng startup. Para sa isang tim ng apat, iyon ay humigit-kumulang $28,250 bawat tao kada buwan lamang sa mga gastos sa AI, bago pa ang mga sahod, espasyo sa opisina, o anumang iba pang gastos na kailangan upang magpatuloy ang isang negosyo.
Ang malaking pagpapalit ng modelo
Ang data sa gitna ng 2026 ay nagtuturo sa isang pagtaas sa paggamit ng enterprise sa mga kasangkapan para sa AI routing at orchestration na awtomatikong nagpapalit sa pagitan ng mga modelo batay sa gastos at kakayahan. Hindi lahat ng query ay kailangan ng pinakamalakas na modelo na available. Ang isang simpleng task sa text classification ay hindi kailangan ng parehong lakas kaysa sa pagbuo ng isang kumplikadong legal na pagsusuri.
Ang kompetitibong presyur mula sa mga Chinese AI model ay nagturbo sa trend na ito. Noong 2024, binigay ni ByteDance ang mga AI service na may presyo na hanggang 99.8% mas mababa kaysa sa mga rate ng GPT-4. Ang mas mababang compute models ni DeepSeek, na dumating noong unang bahagi ng 2025, ay nagpalalakas pa ng paggalaw tungo sa mas mataas na cost-efficiency.
Naramdaman ng OpenAI at Anthropic ang presyon
Ibinabawas ng OpenAI ang presyo ng mga token para sa mga enterprise. Inaasahan na susundan ng Anthropic.
Para sa mga investor na sinusubaybayan ang larangan na ito, mahalaga ang mga epekto ng margin compression. Kung ipinipilit ng dalawang pinakamalaking Western AI model provider na makipag-away sa presyo sa mga Chinese na kalaban at sa mga open-source na alternatibo nang sabay-sabay, mas mahahaba ang landas patungo sa profitability. Ang $252.3B na ipinadala sa corporate AI noong 2024 ay batay sa mga aksiyon tungkol sa pricing power na tila lalong nagiging mahina.
