Ang industriya ng AI ay malapit nang makarating sa isang punto ng pagbabago. Ayon sa Epoch AI, isang nonprofit na sumusunod sa mga trend sa artificial intelligence, ang compute power na nakalaan para sa pagpapatakbo ng AI models ay magiging mas mabilis na lumalago kaysa sa compute power na ginagamit para sa pagbuo nito bago ang 2030.
Ang mga numero sa likod ng pagbabago
Ang mga proyeksyon ni Epoch AI ay naglalarawan ng isang industriya kung saan ang ekonomiks ng pag-deploy ay lalong lalong magiging mas mahalaga kaysa sa ekonomiks ng pag-unlad. Ipinapahiwatig ng organisasyon na halos kalahati ng lahat ng inference compute ay magmigrasyon sa ASICs, o Application-Specific Integrated Circuits, sa dulo ng dekada. Ito ay mga chip na disenyo para gawin ang isang bagay nang napakadali, kumpara sa mga general-purpose GPUs na kasalukuyang nagpapagana sa karamihan ng AI workloads.
Samantala, ang bahagi ng training compute sa kabuuang AI operations ay inaasahang mananatili sa halos 5%. Ang training compute para sa mga frontier AI model ay kasalukuyang tumataas sa taun-taong rate ng 4 hanggang 5 beses. Ang kabuuang installed AI compute base ay lumalawak sa parehong bilis.
Sa kasaysayan, ang inference ay nangunguna na sa 60% hanggang 80% ng compute sa mga aktwal na pagpapatupad.
Sa pamamagitan ng 2030, inaasahan na ang mga pagpapatakbo ng pagtuturo sa frontier ay makarating sa halos 2e29 FLOP. Ang pag-unlad na ito ay katumbas ng paglakas mula sa GPT-2 hanggang GPT-4, na suportado ng mga yaman na nagkakahalaga ng higit sa $100 bilyon. Bawat isa sa mga pagpapatakbo ng pagtuturo sa frontier ay maaaring magkakaroon ng pangangailangan sa pagitan ng 4 at 16 gigawatts ng compute power.
Ipinaglalagay ng Epoch AI na ang kabuuang kapasidad ng AI power sa US ay maaaring lalampas sa 50 GW bago ang 2030, kasama ang global na kapasidad na lalampas sa 100 GW.
Bakit ang ASICs ay kumakain ng inference
Nakakita na ng Google ito noong maraming taon na ang nakalipas gamit ang mga Tensor Processing Unit nito. Mayroon ang Amazon sa mga chip na Inferentia nito. Ang trend na ipinapahiwatig ng Epoch AI ay nagpapakita na hindi ito isang niche na estratehiya kundi ang direksyon na hahaluan ng halos kalahati ng inference market sa katapusan ng dekada.
Hindi trivial ang mga limitasyon sa track na ito ng paglago. Ang pangangailangan sa enerhiya, kakayahan sa paggawa ng chip, at mga limitasyon sa pagpapadala ng data ay lahat ay nagtataglay ng mga totoong hamon. Ang pagtataya ni Epoch AI ay ang mga bottleneck na ito ay maipapamahala sa ilalim ng kasalukuyang mga asumpsyon sa paglago.
Ano ang ibig sabihin nito para sa mga investor
Kung ang inference compute ang direksyon ng paglago, ang investment thesis para sa sektor ng semiconductor ay nagbabago nang malaki. Patuloy pa ring kailangan ng GPUs ang training, at patuloy pa ring tumataas ang budget para sa training sa rate ng 4 hanggang 5x taon-taon. Ngunit ang mas malaking volume at recurring revenue opportunity ay lalo na nasa inference.
Kapag nag-uusap ka tungkol sa 50 GW ng kapasidad ng AI power sa US lamang, iyon ay isang malaking pagpapalawak ng mga data center, paggawa ng enerhiya, at mga sistema ng pagpapalamig.
Ang panganib na dapat bisigil ay kung ang 4 hanggang 5x taunang paglago sa compute ay mapanatili. Ang mga proyeksyon ni Epoch AI ay nagtatayang mananatili ang kasalukuyang mga tren, ngunit ang mga limitasyon sa enerhiya at dinamikang pagkakasuplay ng chip sa geopolitical ay maaaring magdulot ng mga hadlang.
