Bakit Mabilis ang Pag-unlad ng AI ng China? Mga Pananaw Mula sa Mga Laboratorio

icon MarsBit
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ang sektor ng AI ng China ay umaasal, na hinahabol ng malakas na pagkakaroon ng pagpapakilala, pagsasamahan sa open-source, at pag-unlad batay sa tim. Ang mga lab ay nagpaprioritize sa pagpapatupad kaysa sa pagkilala sa indibidwal. Dumadami ang open interest sa mga asset na kaugnay ng AI habang lumalawak ang impluwensya ng mga pangunahing kumpanya tulad ng Alibaba at ByteDance. Ipinapakita ng index ng takot at kagalakan sa mga merkado ng AI ang paglalago ng pagkakaroon ng pag-asa. Ang suporta ng gobyerno at ang imprastruktura ng data ay nagpapalakas pa sa momentum.

Editor’s Note: Ang mga Chinese AI lab ay nagsisiging maging isang puwersa na hindi na maaaring palampasin sa kompetisyon ng mga malalaking modelo sa buong mundo. Ang kanilang mga kahusayan ay hindi lamang ang dami ng talento, lakas ng engineering, at bilis ng pag-update, kundi mula sa isang napakatotoo na paraan ng organisasyon: kaunting pag-uusap tungkol sa mga konsepto, maraming paggawa ng mga modelo; kaunting pagpapahalaga sa mga indibidwal na bituin, maraming pagpapahalaga sa pagpapatakbo ng koponan; kaunting pagkakasalig sa mga panlabas na serbisyo, mas pumipili na magkaroon ng sariling kontrol sa core technology stack.

Pagkatapos makapagbisita sa ilang pangunahing AI lab sa China, natuklasan ni Nathan Lambert na ang ekosistema ng AI sa China ay hindi lubos na katulad ng sa Estados Unidos. Mas pinapahalagahan ng Estados Unidos ang orihinal na paradigma, pagsisikap sa kapital, at personal na impluwensya ng mga lider na siyentipiko; samantalang mas marunong ang China sa mabilis na paghahabol sa mga umiiral na direksyon, sa pamamagitan ng open source, pagpapabuti ng inhenyeriya, at malaking kontribusyon ng maraming batang mananaliksik, upang mabilis na ihahatid ang kakayahan ng mga modelo sa kahulugan.

Hindi ang pagkakaroon ng mas malaking pag-unlad sa AI ng China kaysa sa US ang dapat pagtuunan ng pansin, kundi ang pagkakabuo ng dalawang iba’t ibang landas ng pag-unlad: ang US ay mas katulad ng isang kompetisyon sa harap na dinadala ng kapital at mga sikat na laboratorio, samantalang ang China ay mas katulad ng isang industriyal na kompetisyon na hinahatak ng kakayahan sa inhenyeriya, ang open-source ecosystem, at ang pagkakaroon ng kamalayan sa teknolohikal na kontrol.

Ibig sabihin nito, ang hinaharap na kompetisyon sa AI ay hindi lamang pagtataya sa mga listahan ng modelo, kundi pati na rin sa kakayahan ng organisasyon, ang ekosistema ng mga developer, at ang pagpapatupad sa industriya. Ang tunay na pagbabago sa Chinese AI ay nasa pagkakaroon nito ng sariling paraan upang makilahok sa mga pangunahing pag-unlad sa buong mundo, at hindi na lamang pagkopya sa Silicon Valley.

Ang sumusunod ay ang orihinal na teksto:

Nakatayo sa bagong high-speed train mula sa Hangzhou patungo sa Shanghai, tinitingnan ko ang labas at nakikita ang malinaw na mga balangkas ng mga bundok, na may mga wind turbine na nakalagay sa ibabaw, nagbuo ng mga siluet sa ilalim ng araw na naglalakbay. Ang mga bundok ay nagsisilbing background, habang sa harap ay ang malalaking bukid at mga gusali na may-kaugnayan.

Umulat ako ng malaking pagkamaba-ba sa pagbabalik ko mula sa Tsina. Ang pagtungo sa isang lugar na ganito’y kakaibang lugar, ngunit natanggap ako ng ganitong kagandahang-palad, ay isang napakainit at napakalalim na karanasan. May pagkakataon akong makita ang maraming tao sa AI ecosystem na dati kong kilala lamang sa layo; at tinanggap ako nila ng mga masayang ngiti at pasasalamat, na nagpapaalala sa akin muli na ang aking trabaho at ang buong AI ecosystem ay global.

Ang mentalidad ng mga Chinese researcher

Ang mga kompanya sa Tsina na nagbuo ng language models, maaaring sabihin na napakasuwerteng mga mabilis na sumunod sa teknolohiyang ito. Sila ay batay sa mahabang tradisyon ng edukasyon at kultura sa paggawa sa Tsina, kasama ang iba’t ibang paraan ng pagbuo ng teknolohiyang kompanya kumpara sa Kanluran.

Kung titingnan mo lang ang output—ang pinakabagong at pinakamalaking mga modelo, at ang mga workflow na batay sa agent na suportado nito—at ang mga input tulad ng mga karapat-dapat na mga scientist, malalaking dataset, at mga mapabilis na computing resources, ang mga Chinese at American lab ay tila magkakatulad. Ang tunay na matatag na pagkakaiba ay nangyayari sa paano inorganisa at inanyo ang mga elemento na ito.

Naniniwala ako na isa sa mga dahilan kung bakit sobrang magaling ang mga Chinese laboratoryo sa paghahabol at pagpapanatili sa harap ng mga pag-unlad ay dahil sa kanilang kultura ay lubos na tugma sa gawain na ito. Ngunit bago kong makipag-ugnayan nang direkta sa mga tao, hindi ko itinuturing na ang aking intuisyon ay may malaking epekto. Pagkatapos kong makipag-usap sa maraming mahusay, humble, at bukas na mga siyentipiko sa mga pangunahing Chinese laboratoryo, naging mas malinaw ang aking mga pananaw.

Ang pagbuo ng pinakamahusay na malaking modelo sa wika ngayon ay malaki nang nakadepende sa detalyadong paggawa sa buong teknikal na stack: mula sa data, hanggang sa mga detalye ng arkitektura, at sa pagpapatupad ng mga algoritmo ng reinforcement learning. Ang bawat bahagi ng modelo ay maaaring magdala ng anumang pagpapabuti, at ang pagkakaisa ng mga pagpapabuting ito ay isang kumplikadong proseso. Sa prosesong ito, ang mga gawaing galing sa ilang napakatalino na indibidwal ay maaaring kailangang itigil upang mas makuha ang pinakamataas na pagganap ng buong modelo sa maramihang layuning optima.

Ang mga siyentipiko sa Amerika ay malinaw na napakasigla rin sa paglutas ng mga okasyonal na komponente, ngunit mayroong kultura sa Amerika na "magsalita para sa sarili." Bilang isang siyentipiko, kapag aktibong ipinaglalaban mo ang iyong sariling trabaho para sa atensyon, mas matagumpay ka; at ang kasalukuyang kultura ay nagpapalakas ng isang bagong paraan ng pagiging sikat, kung saan maging "pinakamataas na siyentipiko ng AI." Ito ay magdudulot ng direkta ng pagkakaiba.

Malawak na kumikilos ang alamat na ang Llama organization ay bumagsak dahil sa politikal na presyon pagkatapos ilagay ang mga hiling na ito sa isang hierarkikal na organisasyon. Narinig ko rin mula sa iba pang mga laboratorio na minsan kailangan ng “papayag” sa isang lider na siyentipiko upang itigil ang kanilang paghihingi na hindi isama ang kanilang mga ideya sa huling modelo. Anuman ang katotohanan nito, malinaw ang mensahe: ang pagkakaroon ng sariling kamalayan at pag-asa sa pagtaas sa karera ay talagang nagpapahina sa pagbuo ng pinakamahusay na mga modelo. Kahit isang maliit na kultural na pagkakaiba sa direksyon sa pagitan ng Estados Unidos at Tsina ay maaaring magdulot ng makabuluhang epekto sa huling output.

Ang ilang pagkakaiba ay may kaugnayan sa kung sino ang nagtatayo ng mga modelo sa Tsina. Sa lahat ng mga laboratorio, isang direkta at totoo na katotohanan ay: isang malaking bahagi ng mga pangunahing tagapag-ambag ay mga estudyante pa ring nagsisikap. Ang lahat ng mga laboratorio ay medyo bata, na nagpapalatanda sa amin sa paraan ng pag-organisa namin sa Ai2: ang mga estudyante ay itinuturing na mga kasamahan at direkta na isinasama sa mga koponan ng malalaking modelo sa wika.

Ito ay lubos na iba sa mga pinakamataas na laboratorio sa Amerika. Sa Amerika, ang mga kumpanya tulad ng OpenAI, Anthropic, at Cursor ay hindi nag-aalok ng anumang internship. Ang iba pang kumpanya tulad ng Google ay nag-aalok ng mga internship na kaugnay ng Gemini, ngunit marami ang nag-aalala kung ang kanilang internship ay maaaring isailalim sa labas ng tunay na pangunahing trabaho.

Sa pangkabuuan, ang mga kaunting kulturaal na pagkakaiba ay maaaring mapabuti ang kakayahan ng pagbuo ng modelo: upang mapabuti ang huling modelo, mas handa ang mga tao na gawin ang mga gawain na hindi gaanong nakakalat; ang mga nagsisimula sa pagbuo ng AI ay maaaring hindi maapektuhan ng mga nakaraang siklo ng pagkakalat ng AI, kaya mas mabilis silang makakasabay sa mga modernong paraan sa teknolohiya. Sa katotohanan, isang Chinese na siyentipiko na pinag-usapan ko ay direktang isinasaalang-alang ito bilang isang kahusayan; mas mababang antas ng pagkakaroon ng sarili ay nagpapadali sa paglalawak ng organisasyon, dahil mas kaunti ang mga tao na nagsusumikap na “maglaro sa sistema”; malaking bilang ng mga talento ay perpektong angkop para lutasin ang mga problema na mayroon nang proof-of-concept sa ibang lugar, atbp.

Ang ganitong pagkakasunod-sunod sa pagbuo ng kakayahan ng kasalukuyang mga modelo ng wika ay nagtatagpo sa isang kilalang stereotipo: karaniwang naniniwala ang mga tao na mas kaunti ang mga Chinese researcher na naglalabas ng mga akademikong pag-aaral na mas malikhaing nagpapalawak sa mga bagong larangan—ang mga “mula sa 0 hanggang 1”.

在 mga pagbisita sa ilang mas akademikong laboratoryo sa biyaheng ito, maraming responsable ang nagsabi na pinauunlad nila ang ganitong mas ambisyosong pananaliksik na kultura. Kasabay nito, ang ilan sa mga pinunong teknikal na nakausap namin ay nagdududa kung posible bang maisakatuparan sa panandaliang panahon ang ganitong muling paghubog ng paraan ng siyentipikong pananaliksik, dahil nangangailangan ito ng muling pagdidisenyo ng sistemang pang-edukasyon at mga sistema ng insentibo, at napakalaki ng pagbabagong ito, kaya mahirap itong mangyari sa kasalukuyang balanse ng ekonomiya.

Ang kultura na ito ay tila nagpapalaki ng isang malaking bilang ng mga mag-aaral at inhinyero na napakadali sa pagbuo ng mga laro sa malalaking modelo ng wika. Totoo rin na ang kanilang bilang ay napakalaki.

Sinabi sakin ng mga mag-aaral na nangyayari rin sa China ang parehong pagkawala ng mga talento tulad sa Estados Unidos: marami sa mga dating isinasaalang-alang ang akademikong karera ay ngayon ay nagsisikap na manatili sa industriya. Ang pinakamagiliw na pahayag ay galing sa isang mananaliksik na nais maging propesor—sinabi niya na nais niyang maging propesor dahil gusto niyang maging malapit sa sistema ng edukasyon; ngunit sinundan niya ito sa isang komento na ang edukasyon ay na-resolve na ng malalaking modelo ng wika—“Bakit pa dapat pumunta sa akin ang mga mag-aaral!”

Ang mga mag-aaral na pumapasok sa larangan ng malalaking modelo sa wika na may bagong pananaw ay may kahusayan. Sa mga nakaraang taon, nakita namin ang mga pangunahing paraan sa malalaking modelo sa wika na patuloy na nagbabago: mula sa pagpapalawak ng MoE, hanggang sa pagpapalawak ng reinforcement learning, at pagkatapos ay suporta sa mga agent. Upang gawin nang maayos ang anumang isa sa mga ito, kailangan ng napakabilis na pagkuha ng malaking dami ng background information, kasama ang mas malawak na literatura at ang teknikal na stack ng kompanya.

Kasalukuyang natututo ang mga mag-aaral na gawin ang ganitong uri ng gawain, at handa silang ipagpaliban ang kanilang lahat na mga palagay tungkol sa “ano ang dapat maging epektibo” nang may pagkamapagpakumbaba. Sila’y sumisigla nang buong-pusong mag-invest ng kanilang buhay para lamang makakuha ng pagkakataon na mapabuti ang mga modelo.

Ang mga mag-aaral na ito ay lubos na direkta at walang ilang pilosopikong pag-uusap na maaaring magdulot ng pagkakahati sa mga siyentipiko. Kapag tinanong ko sila kung paano nila itinuturing ang ekonomikong epekto o matagalang sosyal na panganib ng modelo, mas kaunti ang mga Chinese na mananaliksik na may komplikadong pananaw at nais magbigay ng impluwensya sa mga isyung ito. Naniniwala sila na ang kanilang papel ay ang pagbuo ng pinakamahusay na modelo.

Ang pagkakaiba ay subtil at madaling tanggihan. Ngunit mas madaling marinig kapag nag-uusap ka nang mahaba sa isang mahinhin, matalino, at kayang malinaw na ipahayag sa Ingles na mananaliksik: kapag tinanong mo ang ilang mas pilosopikal na tanong tungkol sa AI, ang mga pangunahing tanong na ito ay nananatiling nakakabit sa hangin, at ipinapakita ng kausap ang isang simpleng pagkakalito. Para sa kanila, ito ay isang kategoryal na pagkakamali.

Kahit isang mananaliksik ang sumipi sa sikat na pagsusuring ni Dan Wang: kumpara sa Amerika na pinag-uugnay ng mga abogado, ang China ay pinag-uugnay ng mga inhinyero. Habang tinatalakay ang mga isyung ito, ginamit niya ang pagkukumpara na ito upang bigyang-diin ang kanilang pangarap na bumuo. Sa China, wala pang sistematisadong paraan upang palakasin ang star power ng mga siyentipiko tulad ng mga super-popular na podcast ni Dwarkesh o Lex.

Sinubukan kong hingin ang komento ng mga siyentipiko sa Tsina tungkol sa mga pagkakataong dulot ng AI sa pagkakaroon ng kawalan ng siguro sa ekonomiya, mga tanong na hihigit sa simpleng kakayahan ng AGI, o ang etikal na debate kung paano dapat mag-act ang mga modelo; lahat ng mga ito ay nagdulot sa akin ng pag-unawa sa kanilang pinagmulan at edukasyon (na inedit). Sobrang nakatuon sila sa kanilang trabaho, ngunit lumaki sila sa isang sistema na hindi nagpapahintulot sa pagdiskusyon o pagpapahayag kung paano dapat organisahin o palitan ang lipunan.

Kapag pinaglalayong tingnan ang mas malawak na larawan, lalo na sa Beijing, parang湾区 na naramdaman ko: isang kompetitibong laboratorio na maaaring nasa ilang minuto lang sa paglalakad o pagtataksi. Pagkatapos kong bumaba sa eroplano, dinala ko ang aking sarili sa Beijing Campus ng Alibaba bago pumunta sa hotel. Sa sumusunod na 36 na oras, bisitahin namin ang Zhipu AI, Moonshot AI, Tsinghua University, Meituan, Xiaomi, at 01.ai.

Maliwanag ang paggamit ng DiDi sa Tsina. Kung piliin mo ang XL vehicle type, madalas ay isasakay ka sa isang elektrik na maliit na van na may massage seat. Tinanong namin ang mga mananaliksik tungkol sa labanan para sa mga talento, at sinabi nila na sobrang katulad nito sa karanasan natin sa Amerika. Natural na magpapalitan ng trabaho ang mga mananaliksik, at malaki ang impluwensya ng atmospera sa lugar kung saan pumipili ang mga tao.

Sa China, ang komunidad ng malalaking modelo sa wika ay parang isang ekosistema, hindi mga tribu na naglalaban sa isa't isa. Sa maraming hindi pampublikong usapan, halos lahat ng naririnig ko ay paggalang sa mga kasamahan. Lahat ng mga pagsasaliksik sa China ay nagsisimba sa ByteDance at sa kanilang popularyong modelong Doubao, dahil ito ang tanging nangunguna sa pagsasaliksik na may sariling pagsasakatuparan sa China. Samantala, lahat ng mga pagsasaliksik ay may malaking paggalang sa DeepSeek, na itinuturing nila bilang ang pinakamalikhain sa pagpapatupad sa pananaliksik. Sa Estados Unidos, kapag nag-uusap ka nang hindi pampubliko sa mga miyembro ng isang pagsasaliksik, madalas agad ay lumalabas ang mga alon ng pagkakaibigan.

Ang pinakamalalim sa pagkamodest ng mga siyentipiko sa Tsina ay ang kanilang madalas na pagmamaliw at pagsasabi na iyon ay hindi problema nila sa antas ng negosyo. Sa Amerika, tila lahat ay nakapikit sa iba’t ibang trend ng industriya sa antas ng ekosistema, mula sa mga nagbebenta ng data, hanggang sa computing power, at pati na ang pagsasakop ng pondo.

Mga pagkakaiba at pagkakatulad ng Chinese AI industry at Western laboratories

Kaya ito'y kawili-wili ngayon na bumuo ng isang AI model, dahil hindi na ito lamang tungkol sa pagpupulong ng isang grupo ng mga mahusay na mananaliksik sa iisang gusali upang magtayo ng isang engineering miracle. Noong unang panahon, ganito nga ang kalagayan, ngunit upang mapanatili ang AI business, ang mga malalaking language model ay nagsisilbing isang hybrid: kasali rito ang pagbuo, pag-deploy, pagpaparami ng pondo, at pagpapalaganap ng paggamit sa gawaing ito.

Ang mga pangunahing AI na kumpanya ay umiiral sa isang kumplikadong ekosistema. Ang mga ekosistema na ito ay nagbibigay ng pondo, computing power, data, at iba pang mga yaman upang patuloy na hikayatin ang pag-unlad sa mga harapin.

Sa kanlurang ekosistema, ang paraan ng pagpapagsama ng iba’t ibang mga input na kinakailangan para sa paggawa at pagpapanatili ng malalaking modelo sa wika ay nakakabuo na at naipakita nang sapat. Ang Anthropic at OpenAI ay mga halimbawa. Kaya, kung makakita tayo ng malinaw na pagkakaiba sa paraan ng pag-iisip ng mga Chinese lab sa mga isyung ito, makikita natin kung anong makabuluhang pagkakaiba ang maaaring i-bet ng iba’t ibang kumpanya sa hinaharap. Tiyak na ang mga hinaharap na ito ay malakas na epekto ng pagsasapalaran at/o kakulangan sa computing power.

Nakalista ko ang ilang pinakamalaking natutunan sa "industriyal na antas ng AI" mula sa aking pakikipag-ugnayan sa mga laboratorio:

Una, ang lokal na pangangailangan sa AI ay may mga maagang tanda na.
May isang malawakang diskutadong hipotesis na ang China AI market ay mas maliit dahil ang mga kumpanya sa China ay karaniwang hindi handang magbayad para sa software, kaya't hindi maiiwasan ang pagbuo ng isang malaking inference market na sasagip sa mga laboratorio.

Ngunit ang pagkakataong ito ay naglalapat lamang sa mga gastos sa software na kaugnay ng SaaS ecosystem. Ang SaaS ecosystem ay laging maliit sa kasaysayan ng China. Sa kabilang banda, malinaw na mayroon pa rin ang China ng malaking cloud market.

Isang mahalagang tanong na hindi pa nasasagot: Ang paggastus ng mga Chinese company sa AI, mas katulad ba ito ng SaaS market, na mas maliit ang sukat; o mas katulad ng cloud market, na base sa pangunahing gastos? Ang tanong na ito ay pinag-uusapan pa rin ng mga loob na laboratorio sa China. Sa kabuuan, naniniwala ako na ang AI ay patungo na sa cloud market, at walang tunay na pag-aalala na ang market na nabubuo sa paligid ng mga bagong tool ay hindi makakalago.

Pangalawa, ang karamihan sa mga developer ay malalim na naapektuhan ni Claude.
Bagaman ipinagbawal si Claude sa Tsina sa pangalan, ang karamihan sa mga developer ng AI sa Tsina ay napakasaya sa Claude at kung paano ito nagbago sa paraan nilang pagbuo ng software. Ang pagiging hindi gaanong handa ng Tsina na bumili ng software sa nakaraan ay hindi nangangahulugan na hindi ako makakakita ng isang malaking pagtaas sa pangangailangan para sa pag-iisip sa Tsina.

Ang mga teknikal na propesyonal sa Tsina ay napakapragmatiko, mapagmodesto, at may motibasyon. Ito ang naramdaman ko, mas malakas kaysa sa anumang kasaysayang tradisyon na 'hindi magbili ng software nang libre'.

Ilang mga siyentipiko mula sa Tsina ay nabanggit na ginagamit nila ang kanilang sariling mga kasangkapan tulad ng Kimi o GLM command-line tools, ngunit lahat ay nabanggit na ginagamit nila ang Claude. Nakaabot ng pagkabigla na kaunti lamang ang nabanggit ang Codex, habang ang Codex ay mabilis na naging populär sa Bay Area.

Ikatlo, mayroong pagkakaroon ng pagmamay-ari ng teknolohiya ang mga kumpanya sa Tsina.
Ang Kulturang Tsino ay nagkakaisa sa isang makapangyarihang ekonomikong engine, na naglalabas ng ilang hindi matataas na resulta. Ang isang malalim na pakiramdam na iniwan ko ay ang malaking bilang ng AI models, na nagpapakita ng isang praktikal at balansadong pagkakaroon ng maraming teknolohiyang kumpanya dito. Walang pangkalahatang plano.

Ipinapakilala ng industriya ang paggalang sa ByteDance at Alibaba. Sila ay itinuturing na malalaking incumbent na may malakas na mga yaman na makakapanalo sa maraming merkado. Ang DeepSeek ay isang pinagmamalaking teknikal na lider, ngunit malayo sa pagiging market leader. Sila ang nagtatatakda ng direksyon, ngunit kulang sa istrukturang pang-ekonomiya upang makapanalo sa merkado.

Nanatirang mga kumpanya tulad ng Meituan o Ant Group. Maaaring magulat ang mga Westerner kung bakit sila ay nagbuo rin ng mga modelo na ito. Sa katotohanan, malinaw na itinuturing nila ang mga malalaking language model bilang pangunahing bahagi ng mga teknolohiyang produkto sa hinaharap, kaya kailangan nila ang isang malakas na pundasyon.

Kapag sila ay fine-tuning ang isang malakas na pangkalahatang modelo, ang feedback ng open-source community sa modelo ay gagawing mas matibay ang kanilang tech stack, habang sila ay maaari ring panatilihin ang kanilang sariling internal fine-tuned version para sa kanilang produkto. Ang "open-first" mindset sa industriyang ito, ay malawak na natutukoy ng pragmatismo: ito ay tumutulong sa modelo na makakuha ng malakas na feedback, magbabalik sa open-source community, at magpapalakas sa kanilang sariling misyon.

Ikaapat, ang suporta ng gobyerno ay totoo, ngunit ang laki nito ay hindi pa malinaw.
Madalas na sinasabi ng mga tao na ang pamahalaan ng Tsina ay aktibong tumutulong sa pagbubukas ng kompetisyon sa malalaking modelo sa wika. Ngunit isang sistemang pamahalaan na binubuo ng maraming antas at relatibong de sentralisado, at ang bawat antas ay walang malinaw na gabay na opisyal na nagtatakda kung ano ang dapat gawin nito.

Ang iba’t ibang distrito sa Beijing ay nagkakaroon ng kompetisyon upang makakuha ng mga tech company na magtatatag ng kanilang opisina doon. Ang mga “tulong” na ibinibigay sa mga kumpanyang ito ay malamang ay kasama ang pag-alis ng mga biro ng biro sa proseso ng pagpapautang. Ngunit hanggang saan makakatulong ang ganitong tulong? Maaari ba ng iba’t ibang antas ng pamahalaan na tulungan ang pagkakaroon ng mga talento? Maaari ba silang tulungan ang pagdala ng mga chip nang walang pahintulot?

Sa buong pagbisita, mayroong maraming pagbanggit tungkol sa interes o tulong ng gobyerno, ngunit ang mga kaugnay na impormasyon ay hindi sapat upang magsalaysay ng mga detalye nang may katiyakan, o upang mabuo ang isang tiyak na pananaw kung paano talaga makakapagbago ang gobyerno sa landas ng pag-unlad ng AI sa China.

Walang anumang tanda na ang pinakamataas na antas ng pamahalaan ng Tsina ay nakakaapekto sa anumang teknikal na desisyon ng modelo.

Ika-lima, ang industriya ng data ay mas maliit kaysa sa mga kanluranin.
Narinig namin na ang Anthropic o OpenAI ay nagagastos ng higit sa $10 milyon para sa isang окружение, na kumakalat sa milyon-milyon dolyar bawat taon para sa pagpapalago ng mga hangganan ng reinforcement learning. Kaya, nais naming malaman kung ang mga Chinese lab ay nagbibilang din ng mga окружение mula sa mga American company, o kung mayroon bang isang mirror na lokal na ecosystem na sumusuporta sa kanila.

Hindi ito ganap na “walang industriya ng data,” kundi batay sa kanilang karanasan, ang kalidad ng industriya ng data ay relatibong mababa, kaya madalas mas mabuti na magtatayo ng sariling kapaligiran o data. Ang mga mananaliksik ay magpapalaki ng malaking oras upang gumawa ng mga kapaligiran para sa pagtrabaho ng reinforcement learning, habang ang mga malalaking kumpanya tulad ng ByteDance at Alibaba ay may sariling mga koponan para sa pag-label ng data upang suportahan ito. Lahat ng ito ay sumasalamin sa dating nabanggit na “gumawa sarili, hindi bumili” na pag-iisip.

Ikaanim, malakas ang pangangailangan para sa higit pang mga chip ng NVIDIA.
Ang computing power ng NVIDIA ay ang gold standard sa pag-train, at ang pag-unlad ng bawat isa ay limitado dahil sa kakulangan ng karagdagang computing power. Kung sapat ang supply, malinaw na bibili sila. Ang iba pang accelerators, kabilang ang Huawei, ay nakatanggap ng positibong pagsusuri sa inference. Maraming mga laboratorio ang makakagamit ng mga chip ng Huawei.

Ang mga punto na ito ay naglalarawan ng isang napakalaking iba’t ibang AI ecosystem. Ang paggamit ng mabilis na modelo ng paggawa sa mga Western lab sa kanilang mga Chinese counterpart ay madalas na nagdudulot ng kategoryal na pagkakamali. Ang pangunahing tanong ay kung ang mga iba’t ibang ecosystem na ito ay magpapalabas ng mga modelo na may makabuluhang pagkakaiba; o kung ang mga Chinese model ay laging isasalaysay bilang katulad ng mga advanced American model mula sa 3 hanggang 9 buwan ang nakalipas.

Kongklusyon: Pandaigdigang balanse

Bago ang paglalakbay na ito, kaunti lang ang alam ko tungkol sa Tsina; at nang umalis ako, nararamdaman kong bago lang ako nagsisimulang matutunan. Ang Tsina ay hindi isang lugar na maaaring ilarawan gamit ang mga patakaran o reseta, kundi isang lugar na may napakagawian at kimikal na reaksyon. Ang kulturang ito ay napakaluma, napakalalim, at patuloy na nauugnay sa paraan ng pagbuo ng teknolohiya sa loob ng bansa. Mayroon pa akong maraming dapat matutunan.

Maraming bahagi ng kasalukuyang istruktura ng kapangyarihan sa Estados Unidos ay gumagamit ng kanilang umiiral na pananaw sa Tsina bilang pangunahing psikolohikal na kasangkapan sa paggawa ng desisyon. Pagkatapos kong makipag-ugnayan nang pormal o di-pormal sa lahat ng pangunahing AI lab sa Tsina, natuklasan kong mayroong maraming katangian at instinkto sa Tsina na mahirap i-model ng mga pamamaraan sa paggawa ng desisyon sa Kanluran.

Kahit na tanungin ko nang direkta kung bakit nagbubukas ang mga laboratorio ng kanilang pinakamalakas na mga modelo, mahirap pa rin akong iugnay ang “mindset ng pagmamay-ari” at ang “totoong suporta sa ekosistema”.

Ang laboratoryo dito ay napakapragmatiko at hindi lamang isang absolutista sa open source; hindi lahat ng kanilang mga modelo ay ipinapalabas nang bukas. Ngunit may malalim na intensyon sila sa pagpapalakas sa mga developer, pagpapalakas sa ekosistema, at paggamit ng pagiging bukas bilang paraan upang mas maunawaan ang kanilang mga modelo.

Nagbuo ng kanilang sariling general large language model ang halos lahat ng malalaking tech company sa China. Nakita na natin na ang mga platform-based company tulad ng Meituan at malalaking consumer tech company tulad ng Xiaomi ay naglabas ng open-weight models. Karaniwan lamang bumibili ng serbisyo ang mga katumbas na company sa Amerika.

Ang mga kumpanyang ito ay nagbuo ng malalaking modelo ng wika, hindi para magkaroon ng pagkakataon sa mga paborito o bagong bagay, kundi dahil sa isang malalim at pangunahing pangarap: kontrolin ang kanilang sariling teknikal na stack at pag-unlad sa pinakamahalagang teknolohiya ngayon. Kapag tumingin ako pataas mula sa aking laptop, laging nakikita ko ang mga grupo ng cranes sa horizon—na malinaw na sumasalamin sa mas malawak na kultura at enerhiya ng pagbuo sa Tsina.

Ang pagkamalikhain, kagandahang-loob, at tapat na mainit na pagkatao ng mga siyentipiko mula sa Tsina ay napakalapit sa puso. Sa personal na antas, ang mga krimen na diskusyon sa geopolitika na karaniwan nating makikita sa Amerika ay hindi nagpapalabas sa kanila. Mas marami pang dapat magkaroon ng ganitong simpleng positibong enerhiya sa mundo. Bilang miyembro ng AI community, mas naiisip ko ngayon ang mga pagkakahati-hati na lumalabas sa pagitan ng mga miyembro at grupo batay sa mga label ng bansa.

Kung sinasabi kong hindi ko nais na maging malinaw na lider ang mga Amerikanong laboratorio sa bawat bahagi ng AI tech stack, tatalikod ako. Lalo na sa larangan ng open models kung saan marami akong oras na inilalaan, Amerikano ako, at ito ay isang patotoo na pagpili.

Samantala, hinahangad kong mabuhay at umunlad ang bukas na ekosistema sa buong mundo, dahil ito ay makakalikha ng mas ligtas, mas accessible, at mas kapaki-pakinabang na AI para sa mundo. Ang kasalukuyang tanong ay kung gagawin ba ng mga pagsasarili sa Amerika ang hakbang upang manatili sa ganitong lider na posisyon.

Habang isinusulat ko ang artikulong ito, patuloy na kumakalat ang mga alalahanin tungkol sa epekto ng executive order sa mga open model. Maaari itong dagdagan pa ang kumplikasyon sa pagkakasundo sa pagitan ng liderato ng Estados Unidos at ang global na ecosystem—at hindi ito nagbibigay sa akin ng mas maraming tiwala.

Salamat sa lahat ng karismatikong tao na ako ay nakausap sa Moonshot, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai, at iba pang mga organisasyon. Bawat isa ay sobrang mainit at mabait na nagbigay ng kanilang oras. Habang umuunlad ang aking mga ideya, patuloy kong ihihingi ang aking mga obserbasyon tungkol sa Tsina, kabilang ang mas malawak na kultural na aspeto at ang sariling larangan ng AI.

Malinaw na may kaugnayan ang mga kaalaman na ito sa kuwento na nagmumula sa mga pinakabagong pag-unlad sa AI.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.