May-akda: Ada, Shenchao TechFlow
San Francisco, Convention Center ng San Jose, live sa GTC.
Nakaseseyo si Bill Dally, ang pangunahing siyentipiko ng NVIDIA, sa entablado, kabilang sa kanya si Jeff Dean ng Google. Habang nag-uusap sila, inilabas ni Dally ang isang numero: “Kahit na ang isang standard cell library na may halos 2,500 hanggang 3,000 cells ay kailangang i-port, kailangan ng isang koponan na binubuo ng 8 na inhinyero na magtrabaho nang halos 10 buwan.”
Tinigil niya ito.
Ngayon, kailangan mo lang ng isang GPU card, at i-run ito sa isang gabi.
Walang sigaw mula sa audience, dahil naiintindihan ng lahat ng nakikinig ang kahulugan nito. Ang 10-monedang gawain ng 8 na inhinyero ay nasakop ng isang GPU na gawa sa sarili nila sa isang gabi. At dagdag pa ni Dally: ang mga resulta na nakakuha ay tumutugma o kaya ay hihigit pa sa disenyo ng tao sa tatlong indikador—laki, pagkawala ng enerhiya, at latency.
May balita sa susunod na araw na naginterpretasyon na "gumamit ang NVIDIA ng AI para disenyo ang GPU".
Ngunit ang katotohanan ng sitwasyong ito ay mas kahanga-hanga kaysa sa mga pamagat ng balita.
Ano ang tumatakbo sa loob ng NVIDIA?
Hindi isang black box ang ginagamit ng NVIDIA—mga ilang set ng toolchain na pinagtrabahuhan na ng ilang taon.
Ang NB-Cell ay isang programa batay sa reinforcement learning na espesyalisado sa pinakamahirap na gawain: ang paglipat ng standard cell library. Ang Prefix RL ay naglalayong lutasin ang matagal nang pananaliksik na problema sa pagpapalagay sa chain ng carry-lookahead. Sinabi ni Dally na ang layout na nilikha ng sistema ay “hindi maiisip ng tao,” at mas mataas ang mga pangunahing sukat nito ng halos 20% hanggang 30% kumpara sa mga disenyo ng tao.
Kasama rin ang dalawang loob na LLM, ang Chip Nemo at Bug Nemo. Ibinigay ng NVIDIA ang lahat ng RTL code, arkitekturang dokumentasyon, at disenyo na spesipikasyon ng bawat GPU mula sa kasaysayan sa dalawang malaking modelo. Ayon sa paglalarawan ni Dally, ito ay katumbas ng pagpapakalma ng dalawampung taon ng muskulo memory ng NVIDIA mula sa G80 hanggang sa Blackwell sa isang loob na modelo, kung saan ang mga bago ay direktang makakakonekta sa mga inhinyero na may dalawampung taon ng karanasan.
Kaya na ba ng AI na disenyo ang GPU?
Kabaligtaran naman. Ang orihinal na pahayag ni Dally ay: “Sobrang gustong-gusto kong isabuhay ang araw na maaari kong sabihin nang direkta, ‘Gumawa kayo ng isang bagong GPU para sa akin,’ ngunit malayo pa tayo sa hakbang na iyon.”
Hindi ginawa ng NVIDIA ang GPU gamit ang AI. Ngunit ang isang bagay na ginawa nito ay gagawing hindi makakapag-act ang buong industriya nang walang iyo.
$2 bilyon na pagbili ng EDA hinterland
Noong Disyembre 1, 2025, nag-invest ang NVIDIA ng $2 bilyon sa Synopsys, isa sa mga pangunahing tiglalay sa EDA. Nag-sign ang parehong panig ng isang pagkakasundo para sa kolaboratibong pag-unlad, kung saan isasama ng NVIDIA ang kanilang stack ng accelerated computing sa buong EDA workflow ng Synopsys, at ang Blackwell at susunod na henerasyon ng Rubin GPU ay magsasama ng malalim na integrasyon sa Synopsys.ai.
Kailangan ipaliwanag ang posisyon ng Synopsys. Sa buong mundo, ang bawat advanced-node chip—tulad ng Apple M series, AMD MI series, at Google TPU—ay tumatakbo sa halos lahat ng disenyo sa pamamagitan ng toolchain ng Synopsys o Cadence. Kasama ang Siemens EDA, tinatapos ng tatlong kumpanyang ito ang mga pangunahing kasangkapan sa disenyo ng chip. Maaari mong iwasan ang chip ng Qualcomm, maaari mong iwasan ang production line ng TSMC, ngunit hindi mo maiiwasan ang software ng tatlo sa kanila.
Tatlong buwan pagkatapos ng pag-invest sa Synopsys, inilahad ng NVIDIA ang Cadence, Siemens, at Dassault, at inihayag na lahat ng mga ito ay nagtatayo ng mga AI-powered na kasangkapan para sa disenyo ng chip batay sa NVIDIA GPU.
Ang mga benchmark data na inilabas ni NVIDIA ay tila nakakatakot: mas mabilis ang Synopsys PrimeSim sa Blackwell ng 30 beses, ang Proteus ng 20 beses, at ang Sentaurus ay 12 beses na mas mabilis sa B200 kumpara sa CPU acceleration. Gumamit ang MediaTek ng H100 upang pabilisin ang Cadence Spectre ng 6 beses. Gumamit ang Astera Labs ng Synopsys + NVIDIA upang pabilisin ang chip verification ng 3.5 beses.
May isang detalye na dapat hihiwalayin: Ang Cadence’s Millennium M2000 platform, na nakalabel na “nabuo para sa EDA market, eksklusibong batay sa NVIDIA Blackwell”.
Ang dalawang salitang "eksklusibo" ang pinakamahalagang pagpapahalaga. Ibig sabihin, dating gumagana ang EDA tools sa CPU, kaya nagagamit ng Intel at AMD. Ngayon, para gamitin ang pinakamabilis na EDA, kailangan mong bumili ng mga graphics card ng NVIDIA.
Totoo ngayon ang hugis ng flywheel
Ang wheel ng NVIDIA, ang bersyon na nauunawaan ng karamihan ay ganito: bumibili ng GPU sa mga kumpanya ng AI, tinuturuan ng mga kumpanya ng AI ang malalaking modelo, patunay ng mga malalaking modelo na hindi maaaring palitan ang GPU, at mas maraming tao ang bumibili ng GPU.
Sapat na ang galing na ito. Ngunit may isa pang antas sa ilalim nito.
Ginagamit ng NVIDIA ang sarili nilang mga kasangkapan upang disenyo ang susunod na henerasyon ng GPU, nagtataglay ng pagkakaiba sa epekto sa pagdidisenyo, at pinipigil ang buong industriyal na EDA tool chain sa kanilang sariling hardware. Gusto ng mga kalaban na makahabol, ngunit kahit ang mga kasangkapan para makahabol ay kailangan nilang irinse mula sa ekosistema ng NVIDIA.
Ang pagbaba ng presyo ng mga aktibo ng AMD ay nagmula sa takot na ito sa likod ng kanilang financial report. Kahit na sinasabi ng NVIDIA at Synopsys na “hindi kasama sa pag-invest ang anumang obligasyon na bumili ng hardware ng NVIDIA,” alam ng merkado: ang mga unang paglalabas ng accelerated EDA features ay nasa hardware ng NVIDIA lamang, at ang AMD at Intel ay nakadepende lamang sa isang “path na tinatayo para sa platform ng kanilang pinakamalaking kalaban.”
Isipin ang isang inhinyero ng AMD na nais magdisenyo ng isang chip na katumbas ng Blackwell; nagsisimula siya sa isang tool ng Synopsys na pinakamabilis sa mga GPU ng NVIDIA. Kung gayon, o siya ay tatanggap ng isang proseso ng pagdisenyo na dalawang beses na mas mabagal, o kaya ay kailangan niyang bumili ng maraming mga card ng NVIDIA upang magdisenyo ng isang chip na lalabanan ang NVIDIA.
Ang shovel ay patuloy na nabebenta. Ngunit nagbago ang paraan ng pagbebenta.
Totoong kalagayan ng lokal na GPU
Sa punto na ito, kailangan magbigay ng isang set ng mga numero na magpapabuwas.
Sa taon na nagtagumpay ang NVIDIA na makamit ang net profit na higit sa 70 bilyong dolyar para sa fiscal year 2025, ang mga lokal na GPU na “apat na maliit na dragon”—Moore Threads, Moxi, Biren, at Suanyuan—ay nakaayos sa harap ng bintana ng IPO.
Ipakita ng prospectus ng Moore Threads na mula 2022 hanggang 2024, ang kabuuang net loss sa loob ng tatlong taon ay 5 bilyong yuan, at sa unang kalahati ng 2025, nagkarga ulit ng 271 milyong yuan, na nagresulta sa kabuuang hindi kumpleto at hindi kumpleto na loss na 1.478 bilyong yuan hanggang sa Hunyo 30. Ipinaghahayag ng management ng kumpanya na ang pinakamabilis na maaaring makamit ang profit sa consolidated financial statements ay 2027. Mas mabuti ang Muxi, na may kabuuang loss na higit sa 3 bilyong yuan sa loob ng tatlong taon. Ang pinakamasama ay Billet, na may loss na higit sa 6.3 bilyong yuan sa loob ng tatlo at kalahating taon, at ang kita sa unang kalahati ng 2025 ay lamang 58.9 milyong yuan—mas mababa pa kaysa sa bahagya ng 702 milyong yuan ng Moore Threads sa parehong panahon.
Tingnan ang intensidad ng pag-invest sa pag-unlad. Ang halaga ng pag-aaral ng Moore Threads noong 2022 ay 2422.51% ng kanyang kita, at noong 2024 ay patuloy na mataas na 309.88%. Ang halagang ginugol sa pag-aaral sa isang taon ay higit sa tatlong beses ang kita. Ito ay hindi pagpapatakbo ng negosyo, ito ay pagpapagana sa pamamagitan ng pagtutulo—nagpapatuloy na nakikinabang sa primary market at ang bagong bukas na cửa sa STAR Market.
Mas nakakasagabal sa antas ng mga kasangkapan. Ayon sa dokumento ng IPO ng Huada Jiutian noong 2022, ang mga kasangkapan ay only partially nag-aalok ng suporta sa advanced process ng 5nm. Ang Primarius Electronics ay kayang sakop ang mga node ng 7nm/5nm/3nm, ngunit nagtatrabaho lamang sa mga pribadong kasangkapan, at malayo pa sa buong proseso.
Sinabi nang malinaw ni Liu Weiping, tagapagtatag ng Huada Jiutian: "Mayroon pa ring malaking kakulangan ang lokal na EDA sa suporta para sa mga advanced na proseso, lalo na ang kasalukuyang 7nm, 5nm, at 3nm. Kasalukuyan, ang lokal na EDA ay maaaring magawa sa antas ng 14nm, at bagaman may-akda na sila ng teknolohiya sa 7nm, kailangan pa ng pagsasama-samang pagsisikap ng buong industriya upang maisakatuparan ang malalim na pagkakaisa ng 7nm sa praktikal na aplikasyon."
Ibig sabihin, ang buong proseso ng EDA para sa advanced node ay hindi praktikal pa rin para sa lokal. Ang mga lokal na kumpanya ng GPU ay gumagamit pa rin ng Synopsys at Cadence para sa disenyo ng chip. Noong 2025, ipinahayag ni Trump ang pagpapalabas ng export controls sa lahat ng mahahalagang software, bagaman hindi ito natupad nang may epekto, ang mga EDA tool para sa advanced node sa ilalim ng 7nm ay patuloy na nasa mahigpit na kontrol. Kailan mapapalitan ang lisensya, nasa kamay ng iba ang pambubukas at pampapatay.
Ang reaksyon ng kapital na merkado ay sapat na mahiwaga. Sa araw ng paglalunsad ni Muxi, ang presyo ng mga aktibong pondo ay nagsara sa 829.9 yuan, tumataas ng 692.95% sa isang araw. Pagkatapos ng paglalunsad ng Moer Teng, tumataas ang presyo ng mga aktibong pondo hanggang sa maging ikatlo sa A-share market, na lamang sa likod ng Kweichow Moutai at Cambricon, at ayon sa mga midya na nagsagawa ng kalkulasyon batay sa presyo noon, ang kabuuang halaga ng merkado ay humigit-kumulang 359.5 bilyon yuan.
Ang totoong negosyo sa likod ng mga numero ay ang mga kumpanya na patuloy pa ring nagagastos at nangangailangan ng mga panlabas na kasangkapan na pinagbabawalan upang magdisenyo ng mga chip, ngunit binibigyan ng presyo sa secondary market bilang mga susunod na pagkakataon ng NVIDIA sa lokal.
Ang mga kasangkapan na ginagamit ng mga kumpanyang ito para disenyoan ang mga chip, ay naging bahagi na ng ekosistema ni NVIDIA. Ang $2 bilyong pagsasama ni NVIDIA at Synopsys, at ang etiketa na “exclusive na batay sa NVIDIA Blackwell” para sa Cadence Millennium M2000, ay ginawa ang paghahabol mismo bilang isang paradox.
Isang buong chain mula sa disenyo hanggang sa paggawa
Bumalik sa talakayan tungkol sa GTC.
Nagpakita ng pagkamapagmodong si Dally. “Hindi pa talaga kayang magdisenyo ng chip ang AI nang sarili nito”—ito ang sinabi ng NVIDIA sa loob ng apat hanggang limang taon. Ngunit bawat taon, nagbabago ang paraan ng pagsasabi. Apat na taon ang nakalipas, “maaaring tulungan ng AI ang pagdisenyo”; tatlong taon ang nakalipas, “maaaring automatuhin ng AI ang ilang mga bahagi”; ngayon, “nakakagawa sa isang gabi ng trabaho na 8 tao ang ginawa sa 10 buwan.” Bawat taon, isang hakbang ang inilalabas, at bawat taon, isang pahayag na “malayo pa sa panghuling layunin.” Pagkatapos ng tatlong taon, tingnan mo muli—nagawa na ang nakaraang “malayo pa,” at ang bagong “malayo pa” ay itinakda sa isang posisyon na hindi pa kayang abutin ng lahat ng kalaban.
Ang tanging isang bagay na ginawa ng NVIDIA sa nakaraang labing-dalawang buwan ay: gamitin ang AI sa mga pinakamahalagang bahagi ng supply chain ng chip na may pinakamalalim na competitive advantage, at pagbenta ng mga kasangkapan na ito sa buong industriya sa isang layer-by-layer na paraan.
Ang frontend ng chip design ay napapalitan ng loob na LLM na Chip Nemo; ang migration ng standard cell library at optimization ng layout sa gitna ng proseso ay napapalitan ng NB-Cell at Prefix RL; ang buong EDA tool chain ay nakabukod sa sariling GPU sa pamamagitan ng $2 bilyon ni Synopsys at ang “exclusive Blackwell-based” ni Cadence; ang lithography computation sa manufacturing ay napapalitan ng cuLitho, na ginagamit na ng TSMC.
Mula sa disenyo hanggang sa paggawa, ginawa uli ni NVIDIA ang bawat yugto gamit ang AI. Ang bawat yugto ay nagtatapos sa iisang punto: kung gusto mo ang pinakamabilis na kasangkapan, kailangan mong bumili ng GPU ni NVIDIA.
Nangyari na ang pinakamalungkot na bagay para sa lahat ng mga kalaban na nais gumawa ng isang chip na makakalaban sa Blackwell. Ang EDA tool na ginagamit para disenyo ang chip, ang pinakamabilis na bersyon ay nasa GPU ng NVIDIA; ang mga algorithm library na ginagamit para sa photolithography computation para sa paggawa ng chip, ang pinakamabilis ay ibinibigay ng NVIDIA; at ang computing power na ginagamit para sa pag-train ng AI para sa disenyo, ay patuloy na mga GPU ng NVIDIA.
Ang tao na kailangan mong talunin, ay nagpapautang sa iyo ng lahat ng kagamitan na kailangan mo para talunin siya. Ang renta ay binabayad taon-taon, at tumataas ang kontrata bawat taon.
