Kinabawasan ng DeepSeek ang mga gastos sa API ng 100x, nagpapalabas ng talakayan tungkol sa sentralisasyon ng infrastruktura ng AI

icon MarsBit
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ang on-chain news noong Abril 26, 2026, ay nagpapakita na ang DeepSeek ay binawasan ang mga gastos sa API nang 100x kasama ang paglunsad ng V4. Bumaba ang mga bayarin sa input cache hit sa isang-sampu, at kasama ang mga discount, ang isang milyong token ay nagkakahalaga ng 0.025 RMB ngayon. Ang AI + crypto news ay nagpapakita ng epekto, dahil tumalon ang sektor ng computing ng China’s A-share. Gayunpaman, lumalaki ang mga alalahanin tungkol sa centralization ng AI infrastructure, habang dinadagdagan ng mga malalaking cloud company ang kanilang capex. Ang mga decentralized na alternatibo tulad ng Gonka protocol ay sinusubok ang GPU networks upang labanan ang trend na ito.

—— Mula sa pagsasalita ni Gonka sa LA Hacks 2026

Abril 26, inilabas ni DeepSeek ang bagong pricing ng V4 series API: bumaba ang presyo ng input cache hit sa isang-sampu ng orihinal na presyo, at pagkatapos ng panahon-limited na discount para sa bersyon Pro, ang gastos sa pagproseso ng isang milyong Token ay tumaba sa 0.025 yuan—mas mura ng halos isang daan beses kaysa sa isang taon na ang nakalipas. Ang mga aktibong sektor ng computing power sa A-share ay sumikat nang sabay-sabay, at ang damdamin ng merkado ay naging mainit.

Ngunit sa likod ng mga sigaw ng pagdiriwang, may isang tanong na hindi binabanggit ng sinuman nang direkta: habang ang mga modelo ay nagsisiging mas mura, ang computing power na kailangan upang panaig ang mga modelo ay nagsisiging mas nakakonsentrado.

Hindi maaaring magsingkit ang datos. Sa ikalawang kuartal ng 2025, ang kabuuang kapital na gastusin ng apat na cloud provider—Microsoft, Amazon, Meta, at Google—ay tumataas ng 64% sa 1186 bilyong dolyar kumpara sa nakaraang taon; inaasahang tataas pa ito ng 53% sa buong 2026, patungo sa 5708 bilyong dolyar. Tinataasan ng Google ang kanyang target na ipaglabas na TPU chip sa 2026 ng 50% patungo sa 6 milyon. Ang panahon ng pagpapadala ng mga chip na H100 ng NVIDIA ay nasa ilang mga merkado ay nasa ilang buwan na.

Ang kapangyarihan sa pagtukoy ng presyo sa model layer ay umaalis patungo sa mga developer, ngunit ang kontrol sa compute layer ay kumikinabang nang mas mabilis patungo sa ilang mga malalaking kompanya. Ito ay isang nakatagongunit malalim na konsentrasyon sa panahon ng AI.

Gonka

Sa ilalim ng ganitong konteksto, noong Abril 24, 2026, ang mga co-founder ng Gonka Protocol, Daniil at David Liberman, ay umakyat sa pahayagan ng pangunahing talakayan sa LA Hacks 2026. Ang taunang pinakamalaking hackerthon sa pamantasan ng UCLA, na ito’y pinangunahan ng mga kapatid na Liberman, ay nakaharap sa mga hundreds na pinakamahuhusay na inhinyero na handa nang pumasok sa industriya. Ang kanilang itinatanong, sa panahong ito, ay lubos na malinaw: Kaya pa ba ng decentralized computing?

Isa sa iba pang panig ng pagbaba ng presyo

Ang logika ng pagbaba ng presyo ng DeepSeek V4 ay sa unang tingin ay isang benepisyo ng kahusayan mula sa teknolohikal na pag-unlad—ang bagong mekanismo ng atensyon ay nagpapaliit sa dimensyon ng Token, kasama ang DSA sparse attention, na nagpapababa nang malaki sa pangangailangan para sa computing at video memory. Ngunit ang patuloy na pagbaba ng presyo ay nakadepende sa isang priyoridad: may sapat at murang computing power sa isang lugar.

Ang katotohanan ay ang pinagkukunan ng computing power na “sapat” na ito ay mabilis na kumikilos patungo sa ilang mga node sa buong mundo. Ang CEO ng lider sa optical communications, Lumentum’s CEO Michael Hurlston, ay sinabi noong hindi pa masyadong matagal ang nakalipas na sa kasalukuyang trend, ang kakayahan ng kumpanya hanggang 2028 ay halos lahat ay naka-book na. Ito ay hindi isang problema ng isang kumpanya lamang, kundi isang pangkalahatang pagkabigla sa buong supply chain ng AI infrastructure sa harap ng mabilis na paglago ng pangangailangan.

Ginamit ni Daniil ang isang simpleng ngunit makapanghihikayat na paghahambing sa kanyang talakayan sa LA Hacks: ang computing power ng network ng Bitcoin ay higit na malaki kaysa sa kabuuang computing power ng tatlong cloud data center ng Google, Microsoft, at Amazon—ngunit ano ang ginagawa ng mga computing power na ito? Ito ay ginagamit upang lutasin ang isang hash puzzle na walang nangangailangan ng sagot. Parehong nangyayari sa global na idle GPU computing power: ang mga graphics card sa mga machine ng mga gamer, ang mga server sa mga university computer labs, at ang mga sobrang capacity ng mga maliit at katamtamang cloud service providers—kung saan ang kabuuang sukat ay malaki, ngunit hindi ito maaaring gamitin ng AI reasoning dahil sa kakulangan ng isang coordinated mechanism.

Ang problemang sinusubukan lutasin ni Gonka ay ang problemang ito sa pagkakasundo—gamit ang incentive system ng proof-of-work, i-organize ang mga nag-iisang GPU sa buong mundo upang mabuo ang isang network na kayang tumanggap ng mga tunay na AI inference tasks.

Pangalawa, ang pag-iisip ay ang bagong campo ng pakikidigma

Ang pagbaba ng presyo ng DeepSeek ay nagdulot ng malawakang diskusyon sa Chinese internet tungkol sa “AI para sa lahat.” Ngunit may isang napapaligiran na detalye: ang baba ng presyo ay para sa “presyo ng pagtawag,” hindi para sa “gastos sa computing power.” Habang lumalawak ang AI applications, ang pagtaas ng bilang ng pagtawag sa inference ay eksponensyal—ayon sa mga proyeksyon ng industriya, hanggang 2026, ang inference ay magiging humigit-kumulang dalawang-katlo ng kabuuang pagkakagamit ng AI computing power sa buong mundo.

Ito ay nangangahulugan ng ano? Bawat pagbaba ng isang antas ng presyo ng pagtawag, mas marami ang kinakailangang kabuuang computing power, hindi mas kaunti. Ang "demokratisasyon" ng malalaking modelo, sa ilang paraan, ay nagpapabilis sa pagkonsentrasyon sa antas ng computing power—dahil ang mga player na may malaking computing power lamang ang kayang magpatuloy sa pagpapatakbo ng serbisyo ng inference sa sobrang mababang margin.

Isang struktural na pagkakasara na nabubuo: Sino ang may kontrol sa pisikal na computing power sa side ng reasoning, siya ang may kontrol sa tunay na entry point ng infrastruktura sa panahon ng AI. Sa pananaw na ito, ang kahalagahan ng decentralized computing network ay hindi na lamang isang pagpapababa ng gastos ng 50%, kundi isang struktural na alternatibong daan bago matapos ang centralized lock-in.

Tatlo: Totoong pagtatanong sa mga batang tagapagtatag

Ang mga kalahok sa LA Hacks—mga inhinyero at produkto mula sa mga pinakamataas na paaralan sa California—ay mabilis na makakatugon sa isang hindi romantikong inhinyeriyang pagpili: kung saan na antas ng computing power itatayo ang kanilang produkto.

Ano ang server na ginagamit ng iyong AI product para sa inference?

May kakayahan ka bang mag-migrate kapag inayos ng platform ang kanilang pricing strategy o access policy?

Ang dami ng mga user na iyong tinulungan na makabuo, ay para sa paglikha ng halaga para sa iyo, o para sa pagpapadala ng mga chip sa platform?

Nabawasan na ng mga developer ang mga tanong na ito sa panahon ng Web2: kapag naka-ugnay ang kapalaran ng isang app sa algorithm o mga patakaran sa pagpapamahagi ng platform, ang “independent” ay naging isang salitang kailangang muli pang tukuyin. Ang pagkakasalalay sa computing power sa panahon ng AI ay magpapakopya ng parehong lohika sa antas ng infrastraktura, at dahil mas mataas ang gastos sa pagbabago, mas malakas ang epekto ng pagkakasalalay.

Gonka

Ang hackathon, bilang isang anyo, may sariling pagkakataong pagsasalungat: sa loob ng 36 na oras, gumawa ng isang gumagana ayon sa pinakamaliit na yaman at pinakamabilis na paraan—ito ay eksaktong estado na hinahanap ng mga insentibo ng decentralized network. Nagsalita si Daniil sa pahayagan ng LA Hacks, hindi lamang upang ipakilala ang Gonka, kundi mas maraming tanong sa grupo: Ang inyong mga gagawin sa hinaharap, tutulungan ba nito ang pagpapabilis ng tren ng sentralisasyon, o gagawa ba ito ng mga bagong posibilidad?

apat: PoW 2.0: Isang teknikal na pagsasagawa

Ibinago ng Gonka ang incentive structure ng proof-of-work mula sa hash computation patungo sa AI inference, upang ang halos 100% ng computing power sa network ay direktang tumutugon sa totoong mga gawain. Mayroon itong isang mahalagang teknikal na kinakailangan: ang mga gawain sa AI inference ay dapat maging verifiable at reproducible—binibigyan ng parehong model weights, parehong random seed, at parehong input, ang anumang node ay maaaring muling gawin ang computation at i-verify ang kanyang kahalagahan. Ito ang pangunahing teknikal na hamon ng Gonka mula sa akademikong prototype patungo sa isang gumagana network.

Mula sa pananaw ng ekonomiks, ang kahalagahan ng mekanismo na ito ay: ang halaga ng token ay natural na nakabatay sa gastos ng pisikal na computing power, hindi sa emosyon ng likuididad. Ang mga miner na nag-ambag ng computing power ay nakakatanggap ng kapalit, habang ang mga developer na gumagamit ng computing power ay nagbabayad ng bayarin; ang buong sistema ay may isang sariling siklo ng insentibo na hindi nakasalalay sa kahingian ng anumang intermediate party.

Totoo lang na ang teknikal na kakayahang gawin ay bahagi lamang. Mas mahirap na tanong ay: Sa panahon ng tulin na pagtaas ng pangangailangan sa computing power at ang mga malalaking player ay naglalabas ng milyon-milyon dolyar sa kapital expenditure, maaari ba ang isang distributed computing network na binubuo ng mga kontribusyon ng komunidad na nagmumula sa sarili, makabuo ng tunay na kompetisyon sa laki?

Ang mga early data ni Gonka ay nagbibigay ng isang reference point: sa loob ng higit sa isang taon ng mainnet launch, ang network aggregate hash rate ay umabot mula sa 60 H100 equivalents patungo sa higit sa 10,000, at ang paglago na ito ay galing sa spontaneous participation ng mga hiwalay na node sa buong mundo, hindi sa sentralisadong pagkakaloob. Hindi ito patotoo na nasolusyunan na ang isyu ng scale, ngunit ipinapakita nito na ang incentive mechanism ay epektibong nagpapagalaw ng early growth.

Limang: Mga isyu sa window period

Sa kasaysayan, ang kontrol sa infrastruktura ay madalas ay mabilis na nagkakasundo sa mga unang yugto—ganito sa panahon ng mga tren, sa panahon ng internet, at sa panahon ng mobile internet. Sa bawat pagkakataon, mayroong mga tao na nakahanap ng paraan na magsingit bago magkakaroon ng istandard, at mayroong mga tao na lang naiintindihan na nabawasan na ang kanilang karapatan na makilahok pagkatapos na maging sentralisado na ang sistema.

Saan kasalukuyang yugto ang AI computing infrastructure? Batay sa inaasahang kapital expenditure ng apat na malalaking cloud provider na $570.8 bilyon hanggang 2026, ang sentralisasyon ay nagsisibilis; ngunit batay sa tunay na paggamit ng mga developer, mayroon pa ring malaking dami ng mga mapagkukunan na hindi epektibong ikinokonsolidang nasa panig ng supply. Ang puwang na ito ay ang espasyo kung saan maaaring umiiral ang decentralized network sa istruktura.

Isinama ni Daniil ang isang paghahambing sa kanyang talumpati: Pagkatapos ng pagbagsak ng internet bubble noong 2000, hindi nalabi ang mga ruins, kundi ang mga fiber optic network na nakapalibot sa buong mundo, na sumusuporta sa pagpapatakbo ng digital economy sa mga sumunod na dalawampung taon. Pagkatapos ng pagbaba ng kamalayan sa pag-invest sa AI infrastructure, ang mga compute protocol at incentive mechanisms na nalalabi ay magiging infrastraktura ng susunod na cycle—ang tanong ay, aling mga protocol ang may sapat na matibay na lohika upang manatiling gumana sa ilalim ng presyon.

Hindi ito isang tanong tungkol sa isang partikular na proyekto, kundi isang problema na kailangang harapin ng buong decentralized AI sector: Maaari ba talaga ng mga disenyo ng pamamahala na labanan ang pagkawala ng kontrol sa isang puntos? Maaari ba pangatwiran ang mga pagsusulong na mekanismo pagkatapos ng paglago? Totoo ba ang decentralization ng compute network sa tatlong antas: teknikal na pagpapatupad, paglabas ng token, at desisyon sa pag-update?

Pangwakas

Ang pagbaba ng presyo ni DeepSeek ay nagpapalakas muli ng kuwento ng “demokratisasyon ng AI.” Ngunit ang demokratisasyon ng pagtawag sa pag-iisip at ang demokratisasyon ng infrastrakturang pagpapalakas ay dalawang magkaibang bagay. Ang una ay nangyayari na; ang pangalawa, kung mangyayari man, ay nakasalalay sa kung gaano karaming tao ang seryosong ituturing ito bilang isang engineering problemang dapat lutasin sa mga susunod na taon, at hindi lamang isang magandang kuwento.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.