Isang mananaliksik na sumulat sa ilalim ng pseudonym na Zeitgeist ay sinabi na ang pangangailangan para sa memorya para sa artificial intelligence ay hihigit sa kaya ng mundo na magawa ng mga pagkakataon. Sa kanyang pananaw, ang mga bahagi ng mga tagagawa ng memorya ay maaaring tumaas ng sampung beses mula sa kasalukuyang antas kung sila ay hahalagahan ayon sa totoong pangangailangan para sa compute, hindi ayon sa nakaraang mataas.
Binigyan ni Zeitgeist ang isang nakakatulong na halimbawa: ang isang pamumuhunan na $50,000 sa mga bahagi ng Micron noong Setyembre ng nakaraang taon ay magiging halos $489,000 ngayon. Ayon sa kanya, ilang mga investor ay natatakot na nawala na ang kanilang pagkakataon, habang iba naman ay natatakot na maging “ang likwididad na ginagamit ng mga pangunahing player upang lumabas sa kanilang position.” Iminumungkahi ng analista na tingnan ang pagkakataon nang iba’t ibang paraan, sa pamamagitan ng aritmetika ng pangangailangan sa memorya.
Bakit naging bottleneck ang memory
Ang bawat accelerator ay mayroong fixed amount ng high-speed memory, na kilala bilang HBM, na hindi maaaring palawakin. Ayon sa analista, ang isang standard na H100 chip ay mayroon lamang 80 GB, ang mga bagong henerasyon ay nag-aalok ng hanggang 192 GB, at ang hinaharap na B300 ay may 288 GB. Ang hangganan na ito ang tumutukoy sa bilang ng mga request na maaaring handling ng isang accelerator.
Hindi mula sa mga timbang ng modelo ang pangunahing load, kundi mula sa tinatawag na KV cache: ang session memory na lumalaki kasabay ng bawat nilikhang salita. Ayon sa mga kalkulasyon ni Zeitgeist, isang session na may 128,000-token na konteksto ay nangangailangan ng halos 20 GB ng memorya. Sapat na ang apat na ganitong session upang lubos na magamit ang mga yaman ng isang H100.
Paggamit ng memorya bawat sesyon ayon sa laki ng context window, at bilang ng sesyon bawat H100 accelerator. Pinagmulan: Zeitgeist
Para sa mga advanced na modelo tulad ng Claude Opus 4.8 o GPT-5.5, ang pangangailangan ay mas mataas pa: mula sa 40 GB hanggang 100 GB para sa isang solong habang hiling. Ayon sa analista, dito nagmumula ang dahilan kung bakit bawat karagdagang gigabyte ng memorya ay may halaga na katumbas ng timbang nito sa ginto, habang ang mga tagagawa tulad ng Micron at SK Hynix ay physically hindi kayang palakasin ang produksyon nang sapat.
Ang Epekto ng AI Agent at ang Pagkakalawa sa Demand
Ayon sa Zeitgeist, ang pangunahing pagbabago ay ang paglipat mula sa simpleng chatbots patungo sa AI agents. Habang ang isang karaniwang tanong ay nagdadala ng halos walang bigat sa memorya, ang isang agent na tumatawag nang hiwalay sa mga kasangkapan at nagkukuwenta ng konteksto ay madaling makakarating sa 100,000 tokens o higit pa. Ang isang mag-isa namang knowledge worker na tumatakbo ng sampung ganitong agent nang sabay-sabay ay kailangan ng halos 152 GB ng memorya.
Pinakamataas na paggamit ng memorya bawat knowledge worker sa panahon ng parallel chats at agentic sessions. Pinagmulan: Zeitgeist
Tinutukoy ng analista na mayroong halos 250 milyon na knowledge worker sa buong mundo. Kung ang bilang na ito ay maramihin sa bilang ng mga parehong agentic session, ang pangangailangan sa memorya ay hindi lamang tumataas, kundi “tumitindi.” Ayon sa kanyang pagtataya, may 100 agentic session bawat tao bawat araw, kailangan ng mundo ang halos 60 beses na higit pang memorya kaysa sa gagawin noong 2026.
Kinilala ni Zeitgeist na ang mga algoritmo ay magbabawas ng paggamit ng memorya sa paglipas ng panahon, kasama ang mga bagong “mga paraan ng atensyon” na kaya magbawas ng load ng apat hanggang walong beses. Ngunit sa kanyang pananaw, mas mabilis ang paglago ng demand: ang mga agent ay nagpapalit sa mga simpleng usapan, lumalawak ang mga window ng konteksto mula sa 128,000 hanggang 10 milyong tokens, at ang paggamit ng AI ng bawat manggagawa ay umuusbong mula sa zero patungo sa mga hundreds ng sesyon.
Ayon sa analista, sa isang mundo kung saan ang mga modelo ng wika ay “nakaukit sa bawat aspeto ng araw-araw na buhay,” ang memorya ay naging kritikal na yaman. Sa kanyang paghuhula, ang mga kumpanya na nagpaprodukta nito ay magkakaroon ng hindi kailangang kita.
SK Hynix ang nangunguna sa Samsung habang tumataas ang demand para sa AI memory
Ang sukat ng pagtaas ng memorya ng AI ay nagsisimula nang baguhin ang merkado ng chip. Ang South Korean memory manufacturer na si SK Hynix ay naging pinakamalaking kompanya sa listahan ng bansa, labis dahil sa malakas na position nito sa mga high-bandwidth memory chip na ginagamit para sa mga artificial intelligence workload.
Para sa Zeitgeist, ang pagbabagong ito ay sumusuporta sa mas malawak na teorya na ang memorya producer ay nagsisiging isa sa mga pinakamalaking benepisyaryo ng patuloy na pagpapabilis ng AI infrastructure. Habang tumataas ang demand para sa HBM mas mabilis kaysa sa suplay, ang mga kumpanyang may kakayahang magproduko ng mga advanced memory chip ay maaaring makakita ng malaking pagtaas sa kita at halaga.
