Mga Tala mula sa loob ng mga laboratorio ng AI sa Tsina
May-akda: Nathan Lambert
Isinalin ni Peggy, BlockBeats

Editorial Note: Ang mga Chinese AI lab ay nagsisiging maging isang lakas na hindi na maaaring iwasan sa global competition ng malalaking modelo. Ang kanilang mga pangunahing kakayahan ay hindi lamang ang dami ng talento, lakas ng engineering, at bilis ng pag-iterate, kundi mula sa isang napakatotoo na paraan ng organisasyon: kaunting pag-uusap tungkol sa mga konsepto, maraming paggawa ng modelo; kaunting pagpapahalaga sa mga indibidwal na bituin, maraming pagpapahalaga sa team execution; kaunting pagkakasalig sa mga panlabas na serbisyo, mas pumipili na magkaroon ng sariling kontrol sa core technology stack.

Matapos ang pagbisita ni Nathan Lambert sa mga pangunahing AI laboratoryo sa China, natuklasan niya na ang ekosistema ng AI sa China ay hindi ganito kasing-iba sa Amerika. Mas pinapahalagahan ng Amerika ang orihinal na pamamaraan, pagsisikap sa kapital, at personal na impluwensya ng mga lider na siyentipiko; samantalang mas marunong ang China sa paghahabol nang mabilis sa mga umiiral na direksyon, sa pamamagitan ng open source, pagpapabuti ng inhenyeriya, at malaking pagsisikap ng maraming batang mananaliksik upang mabilis na ihahatid ang kakayahan ng mga modelo sa harap.

Hindi ang pagiging mas higit na maunlad ng China sa AI kaysa sa US ang pinakamahalagang tandaan, kundi ang pagkakabuo ng dalawang iba’t ibang landas ng pag-unlad: ang US ay mas tulad ng isang harapang paligsahan na dinudulot ng kapital at mga sikat na laboratorio, samantalang ang China ay mas tulad ng isang industriyal na paligsahan na hinahatak ng kakayahan sa inhenyeriya, ang open-source ecosystem, at ang pagkakaroon ng kamalayan sa teknolohiyang sarili.

Ibig sabihin nito, ang hinaharap na kompetisyon sa AI ay hindi lamang tungkol sa pagpapalit ng mga listahan ng modelo, kundi pati na rin sa kakayahan ng organisasyon, ang ekosistema ng mga developer, at ang pagpapatupad sa industriya. Ang tunay na pagbabago sa Chinese AI ay nasa pagkakaroon nito ng sariling paraan upang makilahok sa mga pangunahing pag-unlad sa buong mundo, at hindi na lamang sa pagkopya sa Silicon Valley.

Narito ang orihinal:

Nakatayo sa bagong high-speed train mula sa Hangzhou patungo sa Shanghai, tinitingnan ko ang labas ng bintana at nakikita ang malinaw na mga gilid ng bundok na may mga wind turbine na nakalagay sa ibabaw, nagbuo ng mga siluet sa ilalim ng araw na nagtatapos. Ang mga bundok ay nagsisilbing background, habang sa harap ay malawak na mga bukid at mga gusali na nakaayos nang magkakasama.

Umalik ako mula sa Tsina na may malaking pagkamalikhain. Ang pagtungo sa isang lugar na ganito’y kakaibang lugar, ngunit natanggap ako ng ganitong kagandahang-puso, ay isang napakainit at napakalalim na karanasan. May pagkakataon akong makilala ang maraming tao sa AI ecosystem na dati kong kilala lamang sa layo; at tinanggap ako nila ng mga ngiti at pagmamahal na puno ng kasiyahan, na nagpapaalala sa akin muli na ang aking trabaho at ang buong AI ecosystem ay global.

Ang pag-iisip ng mga siyentipiko mula sa Tsina

Ang mga kompanya sa China na nagbuo ng mga language model, maaaring mas mainam na maging «fast follower» sa teknolohiyang ito. Sila ay batay sa matagal nang tradisyon ng edukasyon at kultura sa paggawa sa China, kasama ang iba’t ibang paraan ng pagbuo ng mga teknolohiyang kompanya kumpara sa Kanluran.

Kung titingnan mo lang ang output—ang pinakabagong at pinakamalaking mga modelo, at ang mga workflow na batay sa agent na suportado ng mga ito—at ang mga input tulad ng mga karapat-dapat na scientist, malaking data, at mga mapabilis na computing resources, ang mga Chinese at American lab ay tila magkakapareho. Ang tunay na matatag na pagkakaiba ay nangyayari sa paraan kung paano inorganisa at inanyo ang mga elemento na ito.

Laging naniniwala ako na isa sa mga dahilan kung bakit sobrang magaling ang mga Chinese laboratoryo sa paghahabol at pagpapanatili sa harap ng mga pag-unlad ay dahil sa kanilang kultura ay napakatugma sa gawain na ito. Ngunit bago kong makipag-ugnayan nang direkta sa mga tao, hindi ko itinuturing na ang aking intuisyon ay may malaking epekto. Pagkatapos kong makipag-usap sa maraming mahusay, humble, at bukas na mga siyentipiko sa mga pangunahing Chinese laboratoryo, naging mas malinaw ang aking mga pananaw.

Ang pagbuo ng pinakamahusay na malaking modelo ng wika ngayon ay malaking bahagi ng detalyadong paggawa sa buong teknikal na stack: mula sa data, hanggang sa mga detalye ng arkitektura, at sa pagpapatupad ng mga algoritmo ng reinforcement learning. Ang bawat bahagi ng modelo ay maaaring magdala ng ilang pagpapabuti, at ang pagkakaisa ng mga pagpapabuting ito ay isang kumplikadong proseso. Sa prosesong ito, ang ilang napakatalino at gawaing gawin ng mga indibidwal ay maaaring kailangang itigil upang ma-maximize ang kabuuang modelo sa maramihang layuning optima.

Napakadali ng mga Amerikanong siyentipiko sa paglutas ng mga isang komponenteng problema, ngunit mayroong mas malakas na kultura sa Estados Unidos na «magsalita para sa sarili». Bilang isang siyentipiko, kapag aktibong ipinaglalaban mo ang iyong sariling trabaho para sa atensyon, mas matagumpay ka; at ang kasalukuyang kultura ay nagpapalakas ng isang bagong paraan ng pagiging sikat, kung saan magiging «top AI scientist». Ito ay magdudulot ng direktaing pagkakaiba.

Malawak na itinuturing na bumagsak ang Llama organization pagkatapos ma-embed ang mga hiling na ito sa isang hierarkikal na organisasyon dahil sa politikal na presyon. Narinig ko rin mula sa iba pang mga laboratorio na minsan kailangan ng “pagsasakripisyo” sa isang lider na siyentipiko upang ipigil ang kanilang paghihingi na hindi isama ang kanilang mga ideya sa huling modelo. Anuman ang katotohanan nito, malinaw ang mensahe: ang pagkakaroon ng kahalagahan at pangangailangan para sa pag-unlad ng karera ay talagang nakakabawas sa kakayahan ng mga tao na gawin ang pinakamahusay na modelo. Kahit isang maliit na pagkakaiba sa kultura sa pagitan ng Estados Unidos at China ay maaaring magdulot ng makabuluhang epekto sa huling output.

Ang ilang bahagi ng pagkakaiba ay may kaugnayan sa kung sino ang nagtatayo ng mga modelo sa China. Sa lahat ng mga laboratorio, isang direkta at totoo na katotohanan ay: isang malaking bahagi ng mga pangunahing tagapag-ambag ay mga estudyante pa ring nagsisikap. Ang lahat ng mga laboratorio ay medyo bata, na nagpapalaan sa akin sa aming paraan ng pag-organisa sa Ai2: ang mga estudyante ay itinuturing na kapwa at direkta na isasama sa mga koponan ng malalaking modelo sa wika.

Ito ay lubos na iba sa mga pinakamataas na laboratorio sa Amerika. Sa Amerika, ang mga kumpanya tulad ng OpenAI, Anthropic, at Cursor ay hindi nagtataglay ng anumang internship. Ang iba pang kumpanya tulad ng Google ay nag-aalok ng mga internship na may kaugnayan sa Gemini, ngunit marami ang nag-aalala kung ang kanilang internship ay magiging hiwalay sa tunay na pangunahing trabaho.

Sa pangkabuuan, ang mga kaunting kultural na pagkakaiba ay maaaring mapabuti ang kakayahan sa pagbuo ng modelo: upang mapabuti ang huling modelo, mas handa ang mga tao na gawin ang mga gawain na hindi gaanong nakakangiti; ang mga nagsisimula sa pagbuo ng AI ay maaaring hindi maapektuhan ng mga nakaraang siklo ng pagmamalabis sa AI, kaya mas mabilis silang makakasadya sa mga modernong paraan sa teknolohiya. Sa katotohanan, isang Chinese na siyentipiko na pinag-usapan ko ay direktang isinasaalang-alang ito bilang isang kahusayan; mas mababang antas ng pagkakakilanlan ay nagpapadali sa paglalawak ng organisasyon dahil mas kaunti ang mga tao na nagsusumikap na “maglaro ng sistema”; malaking bilang ng mga talento ay perpektong angkop para lutasin ang mga problema na mayroon nang proof-of-concept sa ibang lugar, atbp.

Ito ay mas nakakatulong sa pagbuo ng kakayahan ng mga modernong language model, na nagsisilbing kontrast sa isang kilalang stereotipo: madalas na naniniwala ang mga tao na mas kaunti ang mga Chinese researcher na naglalabas ng mga akademikong pag-aaral na mas malikhaing “mula sa 0 hanggang 1” na nagbubukas ng mga bagong larangan.

Sa ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilang ilangilangan ng mga tagapag-ugnay sa mga akademikong laboratorio sa paglalakbay na ito, sinabi nila na sila ay nagpapalakas ng iskema ng pananaliksik na may mas malaking pangarap. Samantala, ang mga teknikal na tagapag-ugnay na atin ay nagsalita ay nagdududa kung maaaring maisakatuparan ang pagbabago sa paraan ng agham na pananaliksik sa maikling panahon, dahil nagsasailalim ito sa pagbabago ng sistema ng edukasyon at sistema ng insentibo, na isang pagbabago na sobrang malaki upang mangyari sa kasalukuyan balanse ng ekonomiya.

Ang kultura na ito ay tila nagpapalaki ng isang malaking bilang ng mga mag-aaral at inhinyero na napakaskills sa pagbuo ng mga laro para sa malalaking modelo ng wika. Totoo rin na ang kanilang bilang ay napakadakila.

Sinabi sakin ng mga estudyanteng nangyayari rin sa China ang parehong pagkawala ng mga talento tulad sa Estados Unidos: marami sa mga dating isinasaalang-alang ang akademikong karera ay ngayon ay naghahangad na manatili sa industriya. Ang pinakamagiliw na pahayag ay galing sa isang mananaliksik na dating nais maging propesor, na sinabi niya na nais niyang maging propesor dahil gusto niyang maging malapit sa sistema ng edukasyon; ngunit sinabi niya agad pagkatapos na ang edukasyon ay na-resolve na ng mga malalaking modelo ng wika—“Bakit pa dapat pumunta sa akin ang mga estudyante!”

Ang mga mag-aaral na pumapasok sa larangan ng malalaking modelo sa wika na may bagong pananaw ay may kahusayan. Sa nakaraang ilang taon, nakita namin ang mga pangunahing paraan sa malalaking modelo sa wika na patuloy na nagbabago: mula sa pagpapalawak ng MoE, hanggang sa pagpapalawak ng reinforcement learning, at pagkatapos ay pagpapahintulot sa mga agent. Upang gawin nang maayos ang anumang isa sa mga ito, kailangan ng napakabilis na pagkakaroon ng malawak na kaalaman, kabilang ang mas malawak na literatura at ang teknikal na stack sa loob ng kumpanya.

Kasaligan sa paggawa ng ganitong uri ng bagay, handa rin silang magbahagi ng kanilang mga palagay tungkol sa “ano ang dapat maging epektibo” nang may pagkamapagkumbaba. Sila’y sumisid nang buong-puso, inilalagay ang kanilang buhay para lamang makakuha ng pagkakataon na paunlarin ang modelo.

Ang mga mag-aaral na ito ay lubos na direktang nag-iisip at walang ilang pilosopikong pag-uusap na makakapagdulot ng pagkakahati sa mga siyentipiko. Kapag tinanong ko sila kung paano nila itinuturing ang ekonomikong epekto o matagalang sosyal na panganib ng modelo, mas kaunti ang mga Chinese na mananaliksik na may komplikadong pananaw at nais magbigay ng impluwensya sa mga isyung ito. Naniniwala sila na ang kanilang papel ay ang pagbuo ng pinakamahusay na modelo.

Ang pagkakaiba ay subtil at madaling tanggihan. Ngunit mas madaling marinig kapag nag-uusap ka nang haba-haba sa isang mahinahon, matalino, at kayang malinaw na ipahayag sa Ingles na mananaliksik: kapag tinanong mo ang ilang mas pilosopikal na tanong tungkol sa AI, ang mga pangunahing tanong na ito ay nananatiling nakakapit sa hangin, at ang iyong kapuwa ay nagpapakita ng isang simpleng pagkakalito. Para sa kanila, ito ay isang kategoryal na pagkakamali.

Kahit isang mananaliksik ang sumipi sa sikat na paghuhusga ni Dan Wang: kumpara sa Amerika na pinamumunuan ng mga abugado, ang China ay pinamumunuan ng mga inhinyero. Habang tinatalakay ang mga isyung ito, ginamit niya ang paghahambing na ito upang bigyang-diin ang kanilang pangarap na magtayo. Sa China, wala pang sistematisadong landas na makakapagpapalakas ng star power ng mga siyentipiko ng bansa, tulad ng mga super-popular na podcast tulad ni Dwarkesh o Lex.

Sinubukan kong hingin ang komento ng mga siyentipiko sa China tungkol sa mga pagkakamali sa ekonomiya na dulot ng AI, mga tanong na hihigit sa simpleng kakayahan ng AGI, o ang etikal na debate kung paano dapat magtrabaho ang mga modelo; lahat ng mga ito ay nagdulot sa akin ng pag-unawa sa kanilang pinagmulan at edukasyon (na inedit). Napakadetalye nila sa kanilang trabaho, ngunit lumaki sila sa isang sistema na hindi nagpapahintulot sa pagdiskutu at pagpapahayag kung paano dapat isama ang lipunan o paano ito baguhin.

Kapag pinaglalayong tingnan nang malayo, lalo na ang Beijing, parang湾区 na的感觉 sa akin: isang kompetitibong laboratorio, maaaring nasa ilang minuto lang ng paglalakad o pagtataksi. Pagkatapos kong bumaba sa eroplano, tinitiyak kong bisitahin ang Beijing campus ng Alibaba habang papunta ako sa hotel. Sa susunod na 36 na oras, bisitahin namin ang Zhipu AI, Moonshot AI, Tsinghua University, Meituan, Xiaomi, at 01.ai.

Kasali sa China, madali ang paggamit ng DiDi. Kung piliin mo ang XL na modelo, madalas ay isasakay ka sa isang elektrikong maliit na van na may massage seat. Tinanong namin ang mga mananaliksik tungkol sa pakikidigma para sa mga talento, at sabi nila, sobrang katulad nito sa karanasan natin sa Amerika. Normal na magpapalit ng trabaho ang mga mananaliksik, at malaki ang impluwensya ng atmospera sa lugar kung saan pipiliin ng mga tao na pumunta.

Sa China, ang komunidad ng malalaking modelo ng wika ay parang isang ekosistema, hindi mga tribu na naglalaban sa isa't isa. Sa maraming hindi pampublikong pag-uusap, halos lahat ng aking narinig ay paggalang sa mga kapwa. Lahat ng mga laboratorio sa China ay natakot sa ByteDance at sa kanilang sikat na modelong Doubao, dahil ito ang tanging advanced, closed-source laboratorio sa China. Samantala, napakadakilang paggalang ng lahat ng laboratorio kay DeepSeek, na itinuturing nilang may pinakamalalim na pag-aaral sa pagpapatupad. Sa Estados Unidos, kapag nag-uusap ka nang hindi pampubliko sa mga miyembro ng laboratorio, agad na sumisibol ang mga apoy.

Ang pinakamalalim sa pagkamapagpakumbaba ng mga siyentipiko sa Tsina ay ang kanilang madalas na pagsisigaw at pagsasabi na hindi iyon ang kanilang problema, kahit sa komersyal na antas. Sa Amerika, tila lahat ay nakapagkakasundo sa iba’t ibang trend ng industriya sa antas ng ekosistema, mula sa mga nagbebenta ng data, hanggang sa computing power, at pati na sa pagsasakop ng pondo.

Mga pagkakaiba at pagkakatulad ng Chinese AI industry at Western labs

Kaya ito'y kahanga-hanga ngayon na buuin ang isang AI model, dahil hindi na ito lamang pagpupulong ng mga mahusay na mga mananaliksik sa iisang gusali upang magbuo ng isang engineering miracle. Noong unang panahon, ganito nga ang kalagayan, ngunit upang panatilihin ang AI business, ang mga malalaking wika model ay nagsisilbing isang hybrid: ito ay kasali ang pagbuo, pag-deploy, pagpapautang, at pagpapalaganap ng paggamit sa gawaing ito.

Ang mga pangunahing AI na kumpanya ay umiiral sa isang kumplikadong ekosistema. Ang mga ekosistema na ito ay nagbibigay ng pondo, computing power, data, at iba pang mga yaman upang patuloy na pag-unlad ang mga hangganan.

Sa mga Western ecosystem, ang paraan ng pag-integrate ng mga kinakailangang elemento para sa paglikha at pagpapanatili ng mga malalaking language model ay napapalabas na nang sapat. Ang Anthropic at OpenAI ay mga halimbawa. Kaya, kung makakita tayo ng malinaw na pagkakaiba sa paraan ng pag-iisip ng mga Chinese lab sa mga isyung ito, makikita natin kung ano ang mga makabuluhang pagkakaiba kung saan maaaring magtaya ang iba’t ibang kompanya sa hinaharap. Tiyak na ang mga hinaharap na ito ay malakas na epekto ng pagsasalapi at/o mga limitasyon sa computing power.

Nakalista ko ang ilang pinakamalaking natutunan sa "industriyal na antas ng AI" mula sa aking pakikipag-ugnayan sa mga laboratorio:

Una, ang lokal na pangangailangan sa AI ay may mga maagang tanda na.
May isang malawakang pinag-uusapan na hipotesis na ang Chinese AI market ay mas maliit dahil ang mga Chinese company ay karaniwang hindi handang magbayad para sa software, kaya't hindi maiwasto ang isang malaking inference market na makakatulong sa mga laboratoryo.

Ngunit ang pagkakataong ito ay naglalapat lamang sa mga gastos sa software na kaugnay ng SaaS ecosystem. Ang SaaS ecosystem ay laging maliit sa kasaysayan ng China. Sa kabilang banda, malinaw na mayroon pa ring malaking cloud market sa China.

Isang mahalagang tanong na hindi pa nasasagot: Ang paggastos ng mga Chinese company sa AI, mas katulad ba ito ng SaaS market, na mas maliit ang sukat; o mas katulad ng cloud market, na pangunahing gastos? Ang tanong na ito ay pinag-uusapan pa rin ng mga loob na laboratoryo sa China. Sa kabuuan, naririto ako na ang AI ay mas nagsisiguro na maging katulad ng cloud market, at walang tunay na pag-aalala na ang market na nabubuo sa paligid ng mga bagong tool ay hindi makakalawak.

Ikalawa, ang karamihan sa mga developer ay malalim na naapektuhan ng Claude.
Bagaman ipinagbawal si Claude sa Tsina sa pangalan, ang karamihan sa mga developer ng AI sa Tsina ay napakasaya kay Claude at kung paano ito nagbago sa paraan nilang pagbuo ng software. Ang pagiging hindi gaanong handa ng Tsina na bumili ng software sa nakaraan ay hindi nangangahulugan na hindi ako makikita ng isang malaking pagtaas ng pangangailangan sa pag-iisip sa Tsina.

Ang mga teknikal na propesyonal sa China ay napakapragmatiko, mapagmodestong at may motibasyon. Ito ang naging epekto sa akin, mas malakas kaysa sa anumang nakaraang kaugalian na 'hindi magbili ng software nang libre'.

Ilang mga mananaliksik mula sa Tsina ay binabanggit na ginagamit nila ang kanilang sariling mga kasangkapan tulad ng Kimi o GLM command-line tools, ngunit lahat ay binabanggit na ginagamit nila ang Claude. Ang nakakalito ay maraming tao ang hindi binabanggit ang Codex, habang ang Codex ay mabilis na nagiging populär sa Bay Area.

Ikatlo, mayroong pananaw sa pagmamay-ari ng teknolohiya ang mga kumpanya sa Tsina.
Ang Kulturang Tsino ay nagkakaisa sa isang makapangyarihang ekonomikong engine, na nagpapalabas ng ilang hindi matataas na resulta. Ang isang malalim na pagkakaintindi na natira sa akin ay ang malaking bilang ng AI models, na nagpapakita ng isang praktikal at balansadong pagkakaroon ng maraming teknolohiyang kompanya dito. Wala namang pangkalahatang plano.

Ipinapakilala ng industriya ang paggalang sa ByteDance at Alibaba. Sila ay itinuturing na malalaking established players na makakapanalo sa maraming mga pamilihan dahil sa kanilang malakas na mga yaman. Ang DeepSeek ay isang pinagpaparangal na teknikal na lider, ngunit malayo sa pagiging market leader. Sila ang nagtataguyod ng direksyon, ngunit kulang sa istrukturang pang-ekonomiya upang makapanalo sa pamilihan.

Nanatirang mga kumpanya tulad ng Meituan o Ant Group. Maaaring magkaroon ng pagkabigla ang mga Kanluranin kung bakit sila ay nagbuo rin ng mga modelo na ito. Sa katotohanan, malinaw na itinuturing nila ang mga malalaking modelo sa wika bilang puso ng mga teknolohiyang produkto sa hinaharap, kaya kailangan nila ang isang malakas na pundasyon.

Kapag sila ay fine-tuning ang isang malakas na pangkalahatang modelo, ang feedback ng open-source community sa modelo ay gagawing mas matibay ang kanilang tech stack, habang nananatili silang may internal na version na fine-tuned para sa kanilang sariling produkto. Ang “open-first” mindset sa industriyang ito ay malawak na tinukoy ng pragmatismo: ito ay tumutulong sa modelo na makakuha ng malakas na feedback, magbabalik sa open-source community, at magpapalakas sa kanilang sariling misyon.

Ikaapat, ang suporta ng gobyerno ay totoo, ngunit ang laki nito ay hindi pa malinaw.
Madalas na sinasabi na aktibong tumutulong ang pamahalaan ng Tsina sa pagbubukas ng kompetisyon sa malalaking modelo ng wika. Ngunit isang relatiwong de sentralisadong sistema ng pamahalaan na binubuo ng maraming antas, at ang bawat antas ay walang malinaw na gabay na nagtatakda kung ano ang dapat gawin nito.

Ang iba’t ibang distrito sa Beijing ay nagkakaroon ng kompetisyon upang makakuha ng mga tech company na magtatatag ng kanilang opisina doon. Ang mga “tulong” na ibinibigay sa mga kumpanyang ito ay malamang ay kasama ang pag-alis ng mga biro ng biro sa proseso ng pagpapalala. Ngunit hanggang saan makakatulong ang ganitong tulong? Maaari ba ng iba’t ibang antas ng pamahalaan na tulungan ang pagkakaroon ng mga talento? Maaari ba silang tulungan ang pagdala ng mga chip nang walang pahintulot?

Sa buong pagbisita, mayroong maraming pagbanggit tungkol sa interes o tulong ng gobyerno, ngunit ang mga kaugnay na impormasyon ay malayo sa sapat para maitalaga ang mga detalye sa isang pagpapahayag, o para makabuo ako ng isang tiyak na pananaw kung paano talaga ng gobyerno ang maaaring baguhin ang landas ng pag-unlad ng AI sa China.

Walang anumang tanda na ang pinakamataas na antas ng pamahalaan ng Tsina ay nakakaapekto sa anumang teknikal na desisyon ng modelo.

Ika-lima, ang industriya ng data ay hindi gaanong maunlad kaysa sa Kanluran.
Narinig namin na ang Anthropic o OpenAI ay naglalabas ng higit sa $10 milyon para sa isang environmental, at ang kanilang kumulatibong gastos taon-taon para sa pagpapalago sa mga hangganan ng reinforcement learning ay umabot sa milyon-milyon dolyar. Kaya, nais naming malaman kung ang mga Chinese lab ay kumukuha rin ng mga environmental na iyon mula sa mga American company, o kung mayroon bang isang mirror-like domestic ecosystem na sumusuporta sa kanila.

Hindi ito isang ganap na “walang industriya ng data,” kundi ayon sa kanilang karanasan, ang kalidad ng industriya ng data ay relatibong mababa, kaya madalas mas mabuting magtatayo ng sariling kapaligiran o data. Ang mga mananaliksik ay magugugol ng maraming oras sa paggawa ng mga kapaligiran para sa pag-train ng reinforcement learning, habang ang mga malalaking kumpanya tulad ng ByteDance at Alibaba ay may sariling mga timbangan ng data upang suportahan ito. Lahat ng ito ay sumasalungat sa nabanggit na “magtatayo, hindi bumili” na pag-iisip.

Ikaanim, malakas ang pangangailangan para sa higit pang mga chip ng NVIDIA.
Ang computing power ng NVIDIA ay ang golden standard sa pag-train, at ang pag-unlad ng bawat isa ay limitado dahil sa kakulangan ng karagdagang computing power. Kung sapat ang suplay, malinaw na bibili sila. Ang iba pang accelerators, kabilang ang Huawei, ay nakatanggap ng positibong pagsusuri sa inference. Maraming mga laboratorio ang makakagamit ng mga chip ng Huawei.

Ang mga punto na ito ay naglalarawan ng isang napakaiibang ecosystem ng AI. Ang paggamit ng mabilis na modelo ng paggawa sa mga Western lab sa kanilang mga Chinese counterpart ay madalas na nagdudulot ng kategoryal na pagkakamali. Ang pangunahing tanong ay kung ang mga iba’t ibang ecosystem na ito ay magpapalabas ng mga uri ng modelo na may makabuluhang pagkakaiba; o kung ang mga Chinese model ay laging isasalaysay bilang katumbas ng mga advanced na model sa US na 3 hanggang 9 buwan ang nakalipas.

Kongklusyon: Pandaigdigang balanse

Bago ang paglalakbay na ito, kaunti lang ang alam ko tungkol sa China; at nang umalis ako, nararamdaman kong bago lang ako nag-aaral. Ang China ay hindi isang lugar na maaaring ilarawan gamit ang mga patakaran o reseta, kundi isang lugar na may napakalaking iba’t ibang mekanismo at kimikal na reaksyon. Ang kulturang ito ay napakaluma, napakalalim, at patuloy na nauugnay sa paraan ng pagtatayo ng teknolohiya sa loob ng bansa. May marami pa akong matututunan.

Maraming bahagi ng kasalukuyang estruktura ng kapangyarihan sa Estados Unidos ay gumagamit ng kanilang umiiral na pananaw sa Tsina bilang pangunahing psikolohikal na kasangkapan sa paggawa ng desisyon. Pagkatapos kong makipag-ugnayan nang pormal o di-pormal sa lahat ng pangunahing AI laboratoryo sa Tsina, natuklasan kong mayroong maraming katangian at instinkto sa Tsina na mahirap i-model ng mga pamamaraan sa paggawa ng desisyon sa Kanluran.

Kahit na tanungin ko nang direkta ang mga laboratorio kung bakit sila nagpapalabas ng kanilang pinakamalakas na mga modelo, mahirap pa rin akong iugnay ang pagkakaroon ng "mindset ng pagmamay-ari" at ang "totoong suporta sa ekosistema".

Ang laboratoryo dito ay napakapragmatiko at hindi lamang mga absolutista sa open source; hindi lahat ng kanilang mga modelo ay inilalabas nang bukas. Ngunit may malalim na intensyon sila sa pagtutulungan sa mga developer, pagpapalakas ng ekosistema, at paggamit ng pagkakabukas bilang paraan upang mas maunawaan ang kanilang mga modelo.

Halos lahat ng malalaking teknolohiyang kumpanya sa Tsina ay nagbuo ng kanilang sariling pangkalahatang malaking modelo sa wika. Nakita na natin na ang mga platform na kumpanya tulad ng Meituan at ang mga malalaking konsyumer na teknolohiyang kumpanya tulad ng Xiaomi ay naglabas ng mga modelo na may bukas na timbang. Karaniwan, ang mga katumbas na kumpanya sa Amerika ay tanging bumibili ng serbisyo.

Ang mga kumpanyang ito ay nagbuo ng malalaking modelo ng wika, hindi upang magkaroon ng pagkakataon sa mga paborito o bagong bagay, kundi dahil sa isang malalim at pangunahing pangarap: kontrolin ang kanilang sariling teknikal na stack at pag-unlad ang pinakamahalagang teknolohiya ngayon. Kapag tumingin ako pataas mula sa aking laptop, palaging nakikita ko ang mga grupo ng cranes sa horizon—na malinaw na sumasalamin sa mas malawak na kultura at enerhiya ng pagbuo sa Tsina.

Ang pagkamalapit, kagandahan, at tapat na mainit na pagkatao ng mga Chinese na mananaliksik ay napakalapit sa puso. Sa personal na antas, ang mga mapanghamong diskusyon sa geopolitika na karaniwan nating makikita sa Amerika ay hindi nagkakaroon ng epekto sa kanila. Mas marami pang dapat magkaroon ng ganitong simpleng positibong enerhiya sa mundo. Bilang miyembro ng AI community, mas naiisip ko ngayon ang mga puwang na lumalabas sa pagitan ng mga miyembro at grupo dahil sa mga label ng bansa.

Kung sinasabi kong hindi ko nais na ang mga Amerikanong laboratorio ay maging malinaw na lider sa bawat bahagi ng AI technology stack, tatawagin kong maliit. Lalo na sa larangan ng open models kung saan ako ay nag-ala ng maraming oras, Amerikano ako, at ito ay isang tapat na pagpili.

Samantala, hinahanap ko na mabuhay ang bukas na ekosistema sa buong mundo, dahil ito ay makakatulong sa paglikha ng mas ligtas, mas accessible, at mas kapaki-pakinabang na AI para sa mundo. Ang tanong ngayon ay kung gagawin ba ng mga laboratorio sa Amerika ang hakbang upang umangkop sa lider na posisyon na ito.

Habang isinusulat ko ang artikulong ito, patuloy na kumakalat ang mga alalahanin tungkol sa epekto ng executive order sa mga open model. Maaari itong dagdagan pa ang kahirapan sa pagkakasundo ng pamumuno ng Estados Unidos at ang pandaigdigang ecosystem—na hindi nagbibigay sa akin ng mas maraming tiwala.

Salamat sa lahat ng mga karismatikong tao na nakausap ko sa Moonshot, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai, at iba pang mga organisasyon. Bawat isa ay napakasigla at napakagagawa ng oras. Habang lumalago ang aking mga ideya, ipagpapatuloy kong ibahagi ang aking mga obserbasyon tungkol sa Tsina, kabilang ang mas malawak na kultural na aspeto at ang sariling larangan ng AI.

Malinaw na ang mga kaalaman na ito ay direktang kaugnay sa kuwento na nagpapalaganap kasabay ng mga unang pag-unlad sa AI.

[Original link]

Klik upang malaman ang mga posisyon na hinahanap ng BlockBeats

Maligayang pagdating sa opisyal na komunidad ng BlockBeats:

Telegram subscription group: https://t.me/theblockbeats

Telegram group: https://t.me/BlockBeats_App

Twitter official account: https://twitter.com/BlockBeatsAsia

Kumikita ng pandaigdigang impluwensya ang mga Chinese AI Labs sa pamamagitan ng inhenyeriya at open source

Ang pag-iisip ng mga siyentipiko mula sa Tsina

Mga pagkakaiba at pagkakatulad ng Chinese AI industry at Western labs

Kongklusyon: Pandaigdigang balanse