Ang driverr ng panahon ng AI ay naging Token, hindi na ang model.
Sa nakaraang dalawang taon, ang pangunahing kuwento sa industriya ng AI ay nakatuon sa "labanan ng malalaking modelo" na sinimulan ng mga malalaking kumpanya. Ang bilang ng parameter ay umabot mula sa milyar hanggang trilyon, ang gastos sa pagtatrain ay tumaas mula sa ilang milyong dolyar patungo sa ilang daan-daang milyong dolyar, at ang mga GPU cluster ay lumawak mula sa libo-libo hanggang sa sampung libo ng mga kartang GPU. Lahat ay nag-uusap kung sino ang mas malakas na modelo, at sino ang mas malapit sa AGI, parang ang hangganan ng kompetisyon sa AI ay ang pagsasalaysay ng performans ng malalaking modelo mismo.
At ang oras ay dumating sa 2026, ang pagtitiyak sa industriya ng AI ay nagbago. Ang pinakabagong ulat ng JPMorgan ay nagsasabing ang tunay na magdudulot ng patuloy na paglalawak ng AI infrastructure sa hinaharap ay hindi na ang pag-train ng model, kundi ang malaking pangangailangan sa AI inference. Ang mga AI Agent na nasa buong mundo ang magiging pinakamalaking gumagamit ng computing power, hindi na lamang ang pag-train ng malalaking model. Bawat pagtawag, bawat interaksyon, at bawat pagpapatupad ng gawain ay nagpapagamit ng token. Ang industriya ng AI ay papasok sa isang bagong panahon—mula sa “Panahon ng Model” patungo sa “Panahon ng Token Industry”.
Dahil ang tunay na nagpapagalaw sa mundo ng AI sa hinaharap ay hindi lamang ang mga modelo, kundi ang sistema ng produksyon, distribusyon, pagpaplano, at pagkonsumo na nakabatay sa Token. Lalo na pagkatapos magsimula ang malawakang paglalabas ng AI Agent, ang paraan kung paano ginagawa nang real-time, dinadala sa iba’t ibang rehiyon, dinadiskarte nang dinamiko, at kinokonsumo nang epektibo ang mga Token, ay magiging pinakamahalagang bagong tanong sa buong industriya ng AI.
Tulad ng ipinahayag ni Huang Renxun sa kanyang huling pagsasalita, ang AI ay hindi isang simpleng industriya ng software, kundi isang sistema ng imprastruktura na katulad ng kuryente at internet. Sa kanyang "five-layer cake" arkitektura, ang industriya ng AI ay nahahati sa limang antas: enerhiya, chip, imprastruktura, modelo, at aplikasyon. Samantalang ang industriya ng AI ay umuunlad mula sa "panahon ng pagtuturo" patungo sa "panahon ng pagpapaliwanag", mas gumagamit ang GoodVision AI ng isang "seven-layer cake" na istruktura upang maunawaan ang buong chain ng ekonomiya ng AI na nakabatay sa Token:
Unang antas: Kuryente—Pangunahing enerhiya sa panahon ng AI
Pangalawang layer: AIDC—Token Factory
Ikatlong antas: GPU—Ang makinaryang paggawa ng Token
Ikaapat na antas: LLM—Ang engine ng paggawa ng Token
Panglimang antas: Pagkakalabas ng Token — Ang «grid» sa panahon ng AI
Ikaanim na antas: Pagpapabuti ng Token at Matalinong Pagdudulot—Ang utak sa panahon ng AI
Antas na Pito: AI Agent—Terminal ng Pagkonsumo ng Token
Mula sa enerhiya, GPU, hanggang sa AIDC at edge nodes, at pati na ang model inference at intelligent scheduling, ang AI industry ay bumubuo ng isang walang katulad na “Token industrial system”.
Ngunit sa kasalukuyang yugto, ang sistema na ito ay malayo pa sa pagiging matatag.
Mayroong mga tao na may mga pinakamoderno na GPU ngunit limitado sa enerhiya; mayroong mga tao na nagtatayo ng malalaking AIDC ngunit kulang sa epektibong pagpaplano; mayroong mga tao na nagpapalawak ng makapangyarihang AI Agent ngunit nakakaranas ng mataas na gastos at pagkakatagal sa pagpapatakbo; mayroong mga tao na may kontrol sa mga edge node ngunit hindi makakabuo ng isang magkakaugnay na network. Bagaman ang buong产业链 ay mabilis na umuunlad, mayroon pa ring maraming pagkakahati, pangitain, at mga hadlang sa kahusayan sa pagitan ng bawat antas.
At ang AI industry ay makakapasok lamang sa tunay na 'era ng malawakang paggamit' ng isang intelligent world kapag ang pitong antas ng infrastraktura ay talagang naka-link, naka-coordinate, at naka-connect.
Unang layer ng cake: Kuryente—Ang enerhiya sa panahon ng AI
Ang industriyal na rebolusyon ay nagmamalasakyan sa koga at langis, ang panahon ng internet ay nagmamalasakyan sa traffic at server, habang sa panahon ng AI, ang pinakamababang digmaan ay bumabalik muli sa enerhiya.
Sapagkat ang huling pagkakasunod ng AI ay ang kuryente. Ang pagkakasunod ng kuryente ng isang malaking AI data center ay nasa antas ng isang katamtamang lungsod. Ang mga bagong itinatayo na AIDC (AI data center) sa buong mundo ay nagtatagpo sa iisang problema: maaaring bilhin ang GPU, maaaring itayo ang lupa, ngunit ang suplay ng kuryente at ang pagpaplano ng grid ay hindi nakakasunod.
Ito ang dahilan kung bakit ang mas maraming AI na kumpanya ay nagsisimulang muli na magbigay-pansin sa enerhiya infrastructure. Sa GTC 2026, kinilala ni Jensen Huang ang mga data center sa hinaharap bilang mga “Token factory.” Ang pinakamataas na bahagi ng pabrika ay magdudulot ng isang super enerhiya na industriya.
Sa中国市场, ang Changjiang Power, China National Nuclear Corporation, China General Nuclear Power Corporation, Three Gorges Energy, Longyuan Power, at Huadian New Energy ay kumakatawan sa mga pangunahang direksyon ng enerhiya tulad ng hydro, nuclear, wind, at solar. Sa mga ito, ang nuclear at hydro ay nagsisilbing pinakamahalagang pangunahing enerhiya para sa AIDC dahil sa kanilang matatag na pagbibigay ng kuryente; samantalang ang wind at solar ay nakikinabang sa pagtaas ng pangangailangan ng AI industry sa green power at ESG. Habang patuloy na ipinapalaganap ang "East Data, West Computing" at ang pagtatayo ng malalaking AI data centers, ang ugnayan ng mga bagong enerhiya base at mga sentro ng computing ay mabilis na lumalakas.
Sa merkado ng Estados Unidos, ang mga tradisyonal na kumpanya sa enerhiya tulad ng NextEra Energy, Dominion Energy, Duke Energy, Southern Co., at Exelon ay nagkakaroon din ng benepisyo mula sa paglalawak ng AI data centers. Ang NextEra ay ang pinakamalaking producer ng green power sa North America; ang Dominion ay may kontrol sa mga pangunahing resource sa pagpapadala ng kuryente sa “data center corridor” ng Northern Virginia; samantalang ang Exelon, sa pamamagitan ng kanyang matatag na pagbibigay ng kuryente mula sa nuclear power, ay naging isang malaking tagapag-enjoy ng pangangailangan para sa “24/7 high-stability power” sa panahon ng AI. Sa kabuuan, ang pandaigdigang industriya ng kuryente ay nagpapalit mula sa tradisyonal na utility patungo sa core resource layer sa panahon ng AI infrastructure.

Sa kabuuan, ang kompetisyon sa antas na ito ay nagbabago mula sa “kompetisyon sa presyo ng kuryente” ng mga tradisyonal na kumpanya sa enerhiya, patungo sa “kompetisyon para sa pagkakakilanlan sa enerhiya” sa pagitan ng mga AI data center, cloud providers, at mga kumpanya sa enerhiya sa ilalim. Sino man ang makakalock ng matatag, matagal, at mura na enerhiya, siya ang may kontrol sa unang Dragon Ball ng produksyon ng Token.
Pangalawang layer ng cake: AIDC—Panggawa ng Token
Walang kwenta ang isang GPU lamang, ang tunay na mahalaga ay ang scale ng cluster. Kaya umusbong ang AIDC.
Ito ay parang mga pabrika ng bakal, pwersahan, at produksyon sa panahon ng Industriyal na Rebolusyon na nagpupulong ng libu-libo na GPU upang mabuo ang matatag na kakayahang mag-produce ng Token. Ngunit nagsimula na ring lumabas ang mga problema sa pabrika: ang tradisyonal na pagbuo ng AIDC ay karaniwang tumatagal ng 18 hanggang 36 na buwan, at ang pagpapalawak ng grid ay maaaring kailanganin ng higit pa. Habang tumataas ang pangangailangan sa AI sa eksponensyal na antas, ang bilis ng pagbuo ng mga IDC sa lumang panahon ay hindi na kayang tugunan ang bagong Token ekonomiya.
Sa US stock market, ang Equinix ay isa sa mga pinakamalalaking operator ng data center sa buong mundo, na may higit sa 240 na data center sa higit sa 30 bansa. Ang kanilang pangunahing kahusayan ay hindi lamang ang bilang ng server rooms, kundi ang kanilang global connectivity at mga mapagkukunan ng network na may mababang latency, na ginagawa itong mahalagang node sa pag-deploy ng AI computing power.
Ang Digital Realty ay pumasok sa AI infrastructure sa pamamagitan ng platform na PlatformDIGITAL, na naglilingkod sa mga malalaking cloud service provider at mga financial institution.
Sa中国市场, ang Runze Technology ay isa sa mga pinakakaraniwang AIDC operator sa A-share market. Ang pangunahing negosyo nito ay umunlad mula sa tradisyonal na IDC patungo sa AI computing center, at ang kanilang pangunahing kakayahan ay ang malaking data center, mga mapagkukunan ng kuryente, at kakayahan sa pagpapanatili ng AIDC. Ang AuFei Data at Capital Online ay patuloy na lumalawak sa mga rehiyonal na data center, cloud infrastructure, at pagtatampok ng AI computing power. Ang Sunway Microelectronics naman ay nakatuon sa pakikipagtulungan sa sektor ng pamahalaan, negosyo, at siyentipiko sa kanilang AIDC business.
Ang isa pang grupo ng mga manlalaro ay galing sa “pagbabago ng minahan.” Ang mga kumpanya tulad ng CoreWeave, IREN, Applied Digital, at Cipher Mining, na dati ay may kaugnayan sa pagmimina ng cryptocurrency, ay mabilis na lumipat sa infrastraktura ng AI computing dahil sa biglaang pagtaas ng pangangailangan sa AI GPU. Ang IREN ay nagtatampok ng modelo na “green energy + AI computing,” at nagtatayo ng mga data center na may mataas na density ng GPU gamit ang renewable energy. Ang Applied Digital at Cipher Mining ay nasa proseso ring lumipat mula sa tradisyonal na minahan patungo sa mga infrastraktura ng AI high-performance computing.

Bukod dito, ang pagkakaroon ng marginal, maliit, at modular na AI Factory ay nagsisimula nang maging bagong trend. Tulad ng panahon ng internet na umalis sa mga mainframe patungo sa cloud computing, kailangan ng AI computing power na maging mas distribuido mula sa malalaking sentral na node patungo sa mga regional edge node.
Kaya pinili ng GoodVision AI ang ibang landas: pagbuo ng mas magaan, modular, at mabilis na kopyahin na AI Factory. Kumpara sa tradisyonal na malalaking AIDC, mas binibigyang-diin ng GoodVision AI ang kakayahan sa regional deployment, efficiency ng mataas na densidad na GPU cluster, at integradong koordinasyon ng enerhiya at computing power.
Hindi ito batay sa pagbuo ng isang malaking data center, kundi sa mabilis na pag-deploy ng mga node ng AI Factory sa mga rehiyon na may mataas na populasyon sa buong mundo, karaniwan ay mga maliit na facility ng pagpapagana para sa inference na may kapasidad na 2-4MW. Ang modelo na ito ay hindi lamang nagpapabilis sa pag-access sa lokal na mga mapagkukunan ng enerhiya, kundi mas angkop din sa trend ng pagkalat ng pangangailangan sa AI inference patungo sa edge.
Kung ang tradisyonal na AIDC ay parang malaking pabrika ng bakal sa panahon ng industriya, ang itinatayo ng GoodVision AI ay mas parang isang “regional Token factory” sa panahon ng AI—mas magaan, mas flexible, mas malapit sa mga user, at mas angkop sa direksyon ng pag-unlad ng global na distributed inference network sa hinaharap.
Third-layer cake: GPU—Ang mga生产设备 ng Token
Kung ang kuryente ay ang enerhiya, ang GPU ay ang makinarya sa produksyon. Sa mga unang taon ng pag-usbong ng AI, ang GPU ay pangunahing naglilingkod sa pag-train; ngunit sa hinaharap, mas malaking pangangailangan ang pag-infer. Dahil ang pag-train ay limitado lamang sa ilang mga kumpanya, habang ang pag-infer ay magiging bahagi ng bawat aplikasyon, bawat device, at bawat endpoint. Kailangan ng pag-infer ang mga robot, ang autonomous driving, ang AI eyeglasses, at kahit ang bawat interaksyon sa pagitan ng mga AI Agent sa hinaharap ay magiging real-time na pag-consume ng Token.
Ang NVIDIA ay kasalukuyang ang absolute na puso ng global na industriya ng AI chips. Ang mga produkto nito tulad ng H100, B200, at Blackwell ay halos nagtatag ng mga istandard sa global na AI training at inference. Mas mahalaga pa, ang NVIDIA ay hindi lang nagbebenta ng chips, kundi nagtatayo rin ng isang kompletong ecosystem sa pamamagitan ng CUDA, TensorRT, DGX, HGX at iba pang hardware at software systems. Kaya, ang mga kalaban nito ay hindi lamang kailangang hamunin ang performance ng GPU, kundi ang buong AI software ecosystem.
Ang AMD ay ang pangunahing hamon sa GPU sa kasalukuyan, na may mga pangunahing produkto tulad ng MI300X at iba pang AI GPU. Kumpara sa NVIDIA, mas binibigyang-diin ng AMD ang bukas na ekosistema at ang ROCm software platform, na naghahanap ng mas bukas na paraan upang taratihin ang mga AI developer at mga kliyente mula sa mga negosyo.
Ang Broadcom at Marvell ay kumakatawan sa isang ibang landas—ASIC at high-speed interconnect. Habang lumalalo ang kumplikado ng mga AI inference scenarios, lalong maraming kumpanya ang nagtatry ng paggawa ng custom ASIC chips upang makamit ang mas mataas na efficiency at mas mababang gastos.
Ang Intel ay sumisikap na muling makiisa sa kompetisyon sa infrastraktura ng AI sa pamamagitan ng paggamit ng server CPU at Gaudi AI accelerator card, na naglalayong gamitin ang sariling ecosystem ng CPU.
Sa中国市场, Cambricon ay isa sa mga pinakakatawan na lokal na kumpanya sa AI chip, na nagtatampok ng series ng AI chip na Kunlun at nagbuo ng sariling AI framework na Neuware. Ang Hygon Information naman ay may lisensya sa AMD Zen architecture, at nakatuon sa pag-unlad ng DCU at AI inference market.
Ang mga lokal na kompanya ng GPU tulad ng Moore Threads, Suanyuan Technology, Muxi Shares, at Biren Technology ay kumakatawan sa direksyon ng “pagsisikap ng lokal na pagpapalit” ng mga chip para sa AI sa China. Ang mga ito ay karaniwang nagpapahalaga sa pagkakatugma sa CUDA ecosystem at sumusubok na bumuo ng mga cluster ng lokal na GPU.

Mula sa CUDA ecosystem, hanggang sa HBM memory, at pati na ang Tensor Core, ang core ng buong AI industry ay patuloy na pinapabuti ang “efficiency ng paggawa ng Token sa bawat yunit ng oras.” Samantala, ang GPU at ang mga basehan nito tulad ng server, optical modules, liquid cooling, at switches ay direktang kaugnay sa efficiency ng paggawa ng Token.
Hindi ito kasing sikat ang mga kompanya tulad ng NVIDIA at OpenAI, ngunit sila ang nagpapatakbo ng buong mundo ng AI. Tulad ng Industrial Revolution na kailangan hindi lang ng steam engine, kundi rin ng mga riles, grid ng kuryente, at mga port. Ang AI Revolution ay hindi lamang isang software revolution. Ito ay isang global na pagpapabuti sa supply chain na kumakalat sa enerhiya, chip, network, cloud computing, at infrastructure.

Ang Vertiv ay ang global na lider sa UPS at pagpapamahala ng kuryente para sa data center, na nag-aalok ng pagpapagana ng data center, pagkakabahagi ng kuryente sa rack, at mga sistema ng precision air conditioning.
Ang Yingweike ay ang lider sa A-share market para sa liquid cooling at temperature control systems, na may mga customer tulad ng mga malalaking internet company tulad ng BAT. Kasunod ng pagtaas ng power ng GPU, ang liquid cooling ay nagsisiging mahalagang standard sa AIDC.
Ang mga kumpanya tulad ng Zhongheng Electric, Kehua Data, at Keshida ay may mahalagang posisyon sa mga larangan ng UPS, power systems, at IDC power supply.
Sa direksyon ng network at optical modules, ang mga kompanya tulad ng Zhongji Xuchuang, Xinyisheng, at Tianfu Communications ay nakikinabang sa pagtaas ng demand para sa mabilis na komunikasyon sa loob ng AI clusters.
Sa direksyon ng buong server, ang mga kumpanya tulad ng Dell, HPE, Supermicro, Lenovo, at Inspur ay nagtatanggol ng malaking pag-aayos at pagpapadala ng AI server.
Bagaman hindi direktang nakikita ng huling user ang antas na ito, ito ang nagtatakda kung kaya ba ng AI infrastructure na magtrabaho nang tiyak. Ang liquid cooling, UPS, optical modules, switches, energy storage, at buong server ay tulad ng mga tren, grid ng kuryente, at mga port sa panahon ng industriyalisasyon, at nagiging totoong 'negosyo ng pagbebenta ng pala' sa mundo ng AI.
Fourth layer cake: LLM—Ang engine ng paggawa ng Token
Ang LLM (malaking language model) ang nagdedesisyon kung paano unawain, likhain, at organisahin ang mga token. Sa nakalipas na dalawang taon, ang mga kompanya tulad ng OpenAI, Anthropic, Google, Meta, xAI, at DeepSeek ay nagsimula ng global na "kompetisyon sa malalaking model." Ang bilang ng parameter ay umabot mula sa milyar hanggang trilyon, at ang kakayahan ng mga model ay nagsimulang lumawak mula sa paggawa ng teksto patungo sa multimodal, pag-iisip, code, pagtutulungan ng Agent, at pangmatagalang memorya.
Ngunit habang patuloy na umuunlad ang industriya, nagsimula na ang pamilihan na maunawaan: Ang tunay na mahalaga sa hinaharap ay hindi na kung sino ang may pinakamalaking modelo, kundi sino ang makakapagpapatuloy na pagsasagawa ng mga modelo sa mas mababang gastos at mas mataas na efisensiya. Dahil ang mga modelo mismo ay hindi direktang gumagawa ng halaga, ang tunay na gumagawa ng halaga ay ang proseso ng pagpapaliwanag pagkatapos ng paulit-ulit na paggamit ng modelo.
Ito ay nangangahulugan na ang LLM ay patuloy na umuunlad mula sa nakaraang “pagpapakita ng kakayahan ng model” patungo sa pagiging “Token production engine” sa mundo ng AI.
Ang mga sarado at bukas na modelo tulad ng OpenAI, Anthropic, Google Gemini, at Meta Llama ay naglalaban para sa pinto ng hinaharap na AI ecosystem; samantalang ang mga bagong player tulad ng DeepSeek ay nagsisimula na ring muling hugis ang kompetisyon sa industriya sa pamamagitan ng mas mababang gastos at mas mataas na efficiency sa pagpapatakbo. Sa kasalukuyan, ang kompetisyon sa LLM layer ay hindi na lamang nakatuon sa paghahambing ng bilang ng parameter, at ang mga pamantayan ay nagsisimulang umunlad patungo sa maraming dimensyon:
Gastos ng token
Efficiency ng pag-iisip
Konteksto kakayahan
Multi-Agent Collaboration
Long-term memory
Kapayapaan ng modelo at infrastraktura

Ang tunay na mahalaga sa panahon ng AI ay hindi lamang kung gaano katalino ang malalaking modelo, kundi kung kaya ng modelo na mag-run nang patuloy, sa malawakang saklaw, at sa mababang gastos sa buong mundo. May sariling solusyon din ang GoodVision AI sa antas na ito: sa pamamagitan ng pakikipagtulungan sa mga tagapag-likha ng malalaking modelo, ipinapalabas nila ang mga malalaking modelo sa AI Factory data center, upang makamit ang paglipat mula sa tradisyonal na pagpapautang ng computing power patungo sa direkta na pagbibigay ng Token service; hindi lamang ito ay nagpapataas ng gross profit ng negosyo, kundi mas magandang karanasan din para sa mga user.
Panglimang antas ng cake: Pagkakabahagi ng Token — Ang "kuryente" sa panahon ng AI
Pagkatapos ma-build ang AIDC, lumabas ang susunod na tanong: Paano gagamitin ng buong mundo ang computing power na ito?
Kaya umusbong ang mga platform ng pag-renta ng computing power. Tulad ng “grid system” sa panahon ng AI, hinati at ibinahagi nila ang mga GPU resource na dating sentralisado, at ipinapautang ito sa mga developer, negosyo, at AI applications ayon sa pangangailangan.
Ang AWS, Azure, Google Cloud, Alibaba Cloud, at Tencent Cloud ay patuloy na ang pinakamalakas na mga player sa antas na ito. Mayroon sila ng pinakamalaking global infrastructure para sa cloud computing at patuloy na binubuo ang kanilang mga AI GPU resources sa kanilang IaaS system.
Ngunit habang nagaganap ito, isang pangkat ng “AI-native cloud” ay nagsisimulang mabilis na umusbong. Ang mga kumpanya tulad ng CoreWeave, Nebius, at Nscale ay espesyalisado sa pagbuo ng GPU cloud platform na batay sa mga pangangailangan sa pag-train at pag-infer ng AI. Kumpara sa mga tradisyonal na cloud provider, mas fleksible, mas nakatuon sa AI tasks, at mas marunong sila sa pag-optimize ng GPU clusters.
Ang CoreWeave ay isa sa mga pinakakatawan na kumpanya ng NeoCloud. Unang nagsisimula sa pagmimina ng Ethereum, sumikat ito sa AI GPU cloud services at ngayon ay isang pangunahing suportadong AI infrastructure company ng NVIDIA.
Ang mga lightweight cloud platform tulad ng DigitalOcean at Vultr ay nakatuon sa mga maliit at katamtamang developer at mga startup, na nagtataguyod ng mabilis na deployment at mura na GPU services.
Sa中国市场, maliban sa mga malalaking kumpanya, ang UCloud, Kingsoft Cloud, at Capital Online ay mga pangunahing tagapagbigay sa merkado ng GPU cloud at pagpapautang ng AI computing power. Ang kompetisyon sa antas na ito ay napakatulad sa maagang grid ng kuryente: paano mapapadali ang epektibong pagpapamahagi ng mga nakalat na computing power.

Antas na anim: Pagpapabuti ng Token at Matalinong Pagdudulot—Ang utak sa panahon ng AI
Maaaring ito ang pinakamadaling maiwasan ngunit pinakamahalagang antas ng “cake”. Pagkatapos ng pagtaas ng paggamit ng AI Agent, natuklasan ng mga tao na hindi lahat ng mga gawain ay worth it na i-call ang pinakamahal na malaking modelo. Maraming simpleng gawain, kayang tapusin ng lokal na modelo; maraming real-time na gawain, mas angkop sa edge inference; at maraming privacy na gawain, kahit na hindi maaaring i-upload sa cloud. Pagkatapos ng tanong na “Mayroon bang computing power?”, may karagdagang tanong na “Paano mas matalino ang paggamit ng computing power?”
Samantalang tumataas nang eksponensyal ang pangangailangan para sa Token, ang “pagpapagana ng tamang modelo, sa tamang computing power, para sa tamang gawain” ay ang susi upang gamitin nang maayos at epektibo ang Token. Ito ang isa sa mga direksyon na pinaglalaban ng GoodVision AI maliban sa pagpapalawak ng AI Token factory.
Tulad ng kasalukuyang sistema ng kuryente: may ilang pangangailangan mula sa malalaking grid; may ilang pangangailangan mula sa rooftop solar. At ang tunay na mahalaga, ay ang gitnang "inteligenteng sistema ng pagpaplano".
Ang hinaharap na AI ay magkakaroon ng parehong istruktura: ang mga simpleng gawain ay tataposin ng lokal na maliit na modelo, ang mga kumplikadong gawain ay magtatawag sa malaking modelo sa cloud, ang mga gawain na may mataas na privacy ay masisirva sa edge, at ang mga gawain na may mataas na konkurensya ay susunod sa dinamikong pag-schedule sa hybrid cloud.
Bukod sa Goodvision AI, ang Qingyun Technology, Lambda, OpenRouter, at Fireworks AI ay mga lider din sa token optimization at intelligent scheduling.
At ang piling ito ng “cake” ay may malaking pagkakatulad sa dalawang naunang “cake” — AIDC at pagpapautang ng computing power. Kapag lumalaki ang mga yunit ng GPU, mga regional node, at laki ng mga gawain sa inference, ang simpleng “pagmamay-ari ng computing power” ay hindi na sapat upang makabuo ng matatag na hadlang. Lalong lumalaki ang bilang ng mga operator ng AIDC at mga GPU cloud platform na naiintindihan na ang tunay na magdedesisyon sa efficiency at profit margin sa hinaharap ay hindi lamang ang bilang ng GPU, kundi kung paano din ma-dynamic ang pag-schedule ng mga model, computing power, at token traffic.
Kaya, maraming mga platform na dating nakatuon sa AIDC at GPU cloud ay nagsisimulang umexpand patungo sa “intelligent scheduling layer.” Halimbawa, ang mga kumpanya sa Chinese market tulad ng UCloud, Capital Online, at Sugon ay nagtatry na i-combine ang kanilang GPU cloud infrastructure, multi-cloud resources, at inference scheduling capabilities, at unti-unting lumilipat mula sa “pagbebenta ng computing power” patungo sa “pagpapabuti ng computing power.”

Antas na pito: Mga modelo at Agent—Mga tagapag-consume ng Token
Bagaman ang antas na ito ang pinakamalapit sa mga user at pinakamadaling makakuha ng trapiko, ang kompetisyon ay parehong pinakamalakas. Sa GTC 2026, ipinahayag ni Jensen Huang ang ganitong pananaw: sa hinaharap, bawat kumpanya ay magiging «Token producer at Token consumer».
Isang AI Agent ay maaaring mag-call ng maraming model, maraming tool, at maraming API nang sabay-sabay, at patuloy na magagawa ang pag-iisip, pagpaplano, at pagpapatupad. Ibig sabihin nito, ang dami ng Token na kakainin ng AI sa hinaharap ay magsisilbing mas malaki kaysa sa kasalukuyang sukat ng pag-uusap ng tao sa AI. Ang ilang mga matalinong gumagamit ng AI ngayon ay nagtatayo ng sariling sistema ng maraming Agent na nagtatrabaho nang sabay at nag-iisip isa’t isa, at kumakain ng 1 bilyon na Token araw-araw ay hindi isang malaking bagay.
Hindi ang hinaharap ay 1 bilyon na tao ang gumagamit ng AI, kundi 10 bilyon, kahit 100 bilyon na AI Agent na nagtatrabaho nang sabay-sabay at nagtatawag sa isa’t isa. At ang tunay na bottleneck ay magsisilbi ring lumipat mula sa “kapasidad ng modelo” patungo sa “efisyensiya ng token scheduling.”
Hindi kailangang ipaliwanag ang mga teknolohikong gaint, ang Microsoft, Google, Meta, at Amazon ay naglalagay ng kakayahan ng AI sa lahat ng kanilang produkto sa pamamagitan ng mga sistema sa opisina, paghahanap, social network, at cloud services.
Ang mga kumpanya ng enterprise software tulad ng Adobe, Salesforce, ServiceNow, at Palantir ay mabilis na umuunlad sa direksyon ng enterprise-grade AI Agent at automated workflows. Samantala, ang Hugging Face ay nagsisilbing “Github” ng panahon ng AI. Ito ay hindi lamang isang komunidad ng mga model, kundi isa rin sa mahahalagang imprastruktura sa pandaigdigang AI development ecosystem.
Sa Chinese market, ang mga kumpanya tulad ng iFlytek, Kunlun Wanwei, 360, Kingsoft Office, at SenseTime ay nagpapalawak sa AI assistant, AI office, at AI Agent.
Pagkatapos ay mabuo ang “seven-layer cake”, totoo lang na magiging simula ang AI world
Ang kasalukuyang industriya ng AI ay nasa loob pa rin ng isang hindi pa ganap na matatag na sistema ng imprastruktura.
Mayroong mga tao na may pinakamodernong GPU ngunit limitado sa enerhiya; mayroong mga tao na nagtatayo ng malalaking AIDC ngunit kulang sa epektibong pagpaplano; mayroong mga tao na nagpapalawak ng makapangyarihang modelo at Agent ngunit nakakaranas ng mataas na gastos at pagkaantala sa pagpapatakbo; mayroong mga tao na may kontrol sa mga edge node ngunit hindi makakabuo ng isang pinagsasamang network.
Mula sa enerhiya, AIDC, GPU, hanggang sa LLM, pagpapamahagi ng Token, intelligent scheduling, at AI Agent, bagaman ang buong AI supply chain ay nasa mabilis na pag-unlad, mayroon pa ring maraming pagkakahiwalay, redundancy, at mga bottleneck sa efficiency sa pagitan ng bawat antas.
At ang pagpasok ng industriya ng AI mula sa kasalukuyang 'Panahon ng mga Kasangkapan' patungo sa tunay na 'Panahon ng Malawakang Paggamit' sa isang mundo ng智能化 ay nangyayari lamang kapag ang buong 'seven-layer cake' ay ganap na binuo at nagsisimula nang epektibong magtrabaho nang magkakasama.
Sa hinaharap na mundo ng AI, hindi na ito makakatwiran lamang sa ilang mga malaking teknolohiyang kumpanya na nagtatrabaho sa malalaking modelo, kundi sa milyon-milyon na AI Agent na patuloy na online, patuloy na nagkakasama, at patuloy na gumagamit ng computing power at Token. Bawat pag-uusap, bawat pag-iisip, bawat paggamit ng tool, at bawat awtomatikong pagpapatupad ng gawain, may kasamang koordinasyon ng enerhiya, GPU, network, sistema ng pagdedesisyon, at mga node ng pag-iisip.
At ang ibig sabihin nito ay ang industriya ng AI ay mula sa dating “software logic” ay unti-unting umuunlad bilang isang super industrial system na sumasaklaw sa enerhiya, chip, cloud computing, edge network, at intelligent scheduling.
Tulad ng Industrial Revolution na hindi lamang nangangailangan ng steam engine, kundi pati na rin ang mga riles, grid ng kuryente, at mga port; ang Internet Revolution ay hindi lamang nangangailangan ng PC, kundi pati na rin ang fiber optics, data centers, at cloud computing. Ang tunay na pagiging matatag ng AI Revolution ay hindi lamang ang isang viral na app, kundi ang pagkakaroon ng isang "network ng smart infrastructure" sa buong mundo na kayang mag-produce, mag-distribute, mag-schedule, at mag-consume ng Token.
At kapag nagkakasama na ang pitong antas ng imprastruktura, ang lohika ng pakikipagkompetensya sa industriya ng AI ay magiging ganap na muling binubuo. Ang mga pinakamahalagang kumpanya sa hinaharap ay maaaring hindi na lamang ang may pinakamalaking modelo, kundi ang mga kumpanyang makakakonekta sa enerhiya, computing power, network, modelo, at paggalaw ng Token.

