Catatan dari dalam makmal AI China
Penulis asal: Nathan Lambert
Dikompilasi oleh: Peggy, BlockBeats
Catatan penyunting: Laboratorium AI China sedang menjadi kekuatan yang semakin sukar diabaikan dalam persaingan model besar global. Keunggulan mereka bukan hanya terletak pada jumlah tenaga pakar yang banyak, kekuatan kejuruteraan, dan laju iterasi yang cepat, tetapi juga berasal dari cara organisasi yang sangat praktikal: kurang membincangkan konsep, lebih banyak membuat model; kurang menekankan bintang individu, lebih menekankan pelaksanaan pasukan; kurang bergantung pada perkhidmatan luar, lebih cenderung menguasai stak teknologi sendiri.
Penulis artikel ini, Nathan Lambert, setelah mengunjungi beberapa laboratorium AI terkemuka di China, mendapati bahawa ekosistem AI China tidak sepenuhnya sama dengan Amerika Syarikat. Amerika Syarikat lebih menekankan pada paradigma asli, pelaburan modal, dan kesan peribadi saintis terkemuka; manakala China lebih mahir dalam mengejar pantas arah yang sedia ada melalui sumber terbuka, pengoptimuman kejuruteraan, dan penyertaan besar-besaran oleh penyelidik muda, sehingga mampu membawa kemampuan model ke hadapan dengan cepat.
Yang paling patut diperhatikan bukan sama ada AI China telah melebihi Amerika Syarikat, tetapi dua lintasan pembangunan yang berbeza sedang terbentuk: Amerika Syarikat lebih menyerupai perlumbaan terkini yang didorong oleh modal dan makmal terkenal, manakala China lebih menyerupai perlumbaan industri yang didorong oleh kemampuan kejuruteraan, ekosistem sumber terbuka, dan kesedaran kawalan teknologi sendiri.
Ini bermakna, persaingan AI di masa depan tidak hanya akan menjadi pertarungan di tangga peringkat model, tetapi juga dalam kemampuan organisasi, ekosistem pembangun, dan pelaksanaan industri. Perubahan sebenar dalam AI China terletak pada fakta bahawa ia tidak lagi sekadar meniru Silicon Valley, tetapi terlibat dalam hadapan global dengan cara sendiri.
Berikut ialah teks asal:
Duduk di atas kereta api berkelajuan tinggi moden yang bergerak dari Hangzhou ke Shanghai, saya memandang keluar dari tingkap, melihat garis punggung gunung yang jelas, dengan turbin angin tersebar di atas bukit, membentuk siluet di bawah sinar matahari terbenam. Gunung-ganang membentuk latar belakang, sementara di hadapan saya terhampar ladang-ladang luas dan bangunan-bangunan tinggi yang saling berselang-seli.
Saya kembali dari China dengan kerendahan hati yang besar. Mengunjungi tempat yang begitu asing tetapi diterima dengan sambutan yang begitu hangat adalah pengalaman yang sangat menghangatkan dan sangat manusiawi. Saya berkesempatan bertemu dengan banyak orang dalam ekosistem AI yang sebelumnya hanya saya kenal dari jauh; dan mereka menyambut saya dengan senyuman cerah dan semangat, membuat saya menyadari kembali bahawa pekerjaan saya serta keseluruhan ekosistem AI itu sendiri bersifat global.
Minda penyelidik China
Syarikat China yang sedang membina model bahasa boleh dikatakan sangat sesuai sebagai «pengikut pantas» teknologi ini. Mereka dibina atas asas tradisi budaya pendidikan dan kerja yang panjang di China, bersama dengan cara pembinaan syarikat teknologi yang sedikit berbeza daripada Barat.
Jika hanya melihat output, iaitu model terkini dan terbesar, serta aliran kerja agen yang disokong oleh model-model ini; dan melihat elemen input seperti saintis yang cemerlang, data berskala besar, dan sumber pengkomputan yang dipercepat, maka makmal China dan makmal Amerika kelihatan serupa secara keseluruhan. Perbezaan yang benar-benar berterusan muncul dalam bagaimana elemen-elemen ini diorganisasikan dan dibentuk.
Saya selalu berpendapat, salah satu sebab mengapa laboratorium China sangat mahir dalam mengejar dan tetap berada di garis depan adalah karena kesesuaian budaya mereka dengan tugas ini. Namun, sebelum berinteraksi langsung dengan orang-orangnya, saya merasa tidak pantas mengaitkan intuisi ini dengan pengaruh yang signifikan. Setelah berbincang dengan banyak ilmuwan hebat, rendah hati, dan terbuka di laboratorium terkemuka Tiongkok, banyak pemikiran saya menjadi lebih jelas.
Membina model bahasa besar terbaik hari ini bergantung很大程度上 kepada kerja teliti sepanjang seluruh tumpukan teknologi: dari data, butiran arkaitektur, hingga pelaksanaan algoritma pembelajaran penguatan. Setiap peringkat model berpotensi membawa peningkatan, dan bagaimana menggabungkan peningkatan ini merupakan proses yang kompleks. Dalam proses ini, kerja yang dilakukan oleh individu yang sangat bijak mungkin perlu ditangguhkan supaya model keseluruhan mencapai pengoptimuman maksimum dalam pelbagai matlamat.
Penyelidik Amerika jelas sangat mahir dalam menyelesaikan masalah komponen individu, tetapi Amerika memiliki budaya yang lebih kuat untuk "berbicara untuk diri sendiri". Sebagai seorang saintis, apabila anda secara aktif memperjuangkan perhatian terhadap kerja anda, anda biasanya akan lebih berjaya; dan budaya kontemporari sedang mendorong satu laluan ketenaran baru, iaitu menjadi "scientist AI terkemuka". Ini akan membawa konflik langsung.
Secara meluas, dikatakan bahawa organisasi Llama runtuh selepas tuntutan kepentingan ini dimasukkan ke dalam struktur hierarki akibat tekanan politik. Saya juga pernah mendengar daripada makmal lain bahawa terkadang perlu untuk “menenangkan” seorang penyelidik terkemuka supaya berhenti mengeluh bahawa idea mereka tidak dimasukkan ke dalam model akhir. Walau pun sama ada ini benar sepenuhnya atau tidak, maksudnya jelas: kesedaran diri dan keinginan untuk kemajuan kerjaya memang boleh menghalang orang membina model terbaik. Perbezaan budaya yang sedikit sahaja antara Amerika Syarikat dan China pun boleh memberi kesan bermakna terhadap hasil akhir.
Sebahagian daripada perbezaan ini berkaitan dengan siapa yang membina model-model ini di China. Di semua makmal, satu realiti yang langsung ialah: sebahagian besar penyumbang utama ialah pelajar yang masih belajar. Semua makmal ini agak muda, yang mengingatkan saya kepada cara kami mengatur Ai2: pelajar dianggap sebagai rakan sekerja dan diintegrasikan secara langsung ke dalam pasukan model bahasa besar.
Ini sangat berbeza dengan laboratorium terkemuka di Amerika. Di Amerika, syarikat-syarikat seperti OpenAI, Anthropic, dan Cursor tidak memberikan peluang latihan sama sekali. Syarikat-syarikat lain seperti Google secara rasmi menawarkan latihan yang berkaitan dengan Gemini, tetapi ramai yang risau bahawa latihan mereka mungkin dipisahkan daripada kerja-kerja utama yang sebenar.
Secara ringkas, perbezaan budaya yang sedikit ini mungkin meningkatkan kemampuan pembinaan model dengan cara berikut: untuk meningkatkan model akhir, orang lebih bersedia melakukan pekerjaan yang kurang menarik; mereka yang baru memulakan pembinaan AI mungkin tidak terpengaruh oleh gelombang spekulasi AI sebelumnya, sehingga mampu beradaptasi lebih pantas dengan kaedah teknologi moden terkini. Sebenarnya, seorang saintis China yang saya ajak berbincang secara jelas memandang ini sebagai kelebihan; kesedaran diri yang lebih rendah menjadikan struktur organisasi lebih mudah diperluaskan kerana orang kurang cuba “memanipulasi sistem”; jumlah besar bakat sangat sesuai untuk menyelesaikan masalah yang sudah memiliki bukti konsep di tempat lain, dsb.
Ini lebih selaras dengan kecenderungan semasa dalam pembinaan kemampuan model bahasa, yang bertentangan dengan stereotaip yang telah diketahui: orang sering percaya bahawa penyelidik China kurang menghasilkan penyelidikan akademik yang lebih kreatif dan mampu membuka bidang baharu, iaitu penyelidikan "dari 0 ke 1".
Dalam beberapa lawatan laboratorium yang lebih bersifat akademik dalam perjalanan ini, banyak pemimpin menyatakan bahawa mereka sedang membangunkan budaya penyelidikan yang lebih ambisius. Sementara itu, beberapa pemimpin teknikal yang kami bercakap dengan meragui sama ada perubahan cara ilmu sains ini boleh dicapai dalam jangka pendek, kerana ia memerlukan reka semula sistem pendidikan dan insentif, dan perubahan ini terlalu besar untuk berlaku dalam keseimbangan ekonomi semasa.
Budaya ini kelihatannya sedang melatih sejumlah pelajar dan jurutera yang sangat mahir dalam "permainan pembinaan model bahasa besar". Tentu saja, bilangan mereka juga sangat banyak.
Pelajar-pelajar ini memberitahu saya bahawa kebocoran bakat serupa juga sedang berlaku di China: banyak individu yang sebelumnya mempertimbangkan jalan akademik kini bercadang untuk tetap berada di sektor industri. Pernyataan paling menarik datang dari seorang penyelidik yang awalnya ingin menjadi profesor, yang mengatakan bahawa dia ingin menjadi profesor kerana ingin dekat dengan sistem pendidikan; tetapi kemudian dia memperkatakan bahawa pendidikan telah diselesaikan oleh model bahasa besar—“Kenapa pelajar masih perlu datang berbual dengan saya!”
Pelajar-pelajar memasuki bidang model bahasa besar dengan pandangan segar, yang merupakan kelebihan. Dalam beberapa tahun terakhir, kami melihat paradigma utama model bahasa besar berubah secara berterusan: daripada memperluas MoE, kepada memperluas pembelajaran peningkatan, kemudian menyokong agen. Untuk melakukan mana-mana perkara ini dengan cemerlang, diperlukan penyerapan maklumat latar belakang yang sangat pantas, termasuk literatur yang lebih luas serta teknologi dalaman syarikat.
Pelajar biasa melakukan perkara seperti ini, dan bersedia meletakkan semua anggapan tentang "apa yang seharusnya berkesan" dengan sikap rendah hati. Mereka terjun sepenuhnya, mengorbankan hidup mereka hanya untuk mendapatkan peluang memperbaiki model.
Pelajar-pelajar ini juga sangat langsung dan tanpa perbincangan falsafah yang boleh mengalihkan perhatian saintis. Ketika saya bertanya kepada mereka tentang pandangan mereka terhadap kesan ekonomi model atau risiko sosial jangka panjang, terdapat jauh lebih sedikit penyelidik Cina yang mempunyai pandangan kompleks dan ingin memberi kesan dalam isu-isu ini. Mereka percaya peranan mereka ialah membina model yang terbaik.
Perbezaan ini halus dan mudah ditolak. Tetapi ia paling mudah dirasai apabila anda berbual panjang dengan seorang penyelidik yang anggun, bijak, dan mampu menyatakan dengan jelas dalam bahasa Inggeris: apabila anda menanyakan soalan-soalan yang lebih falsafah mengenai AI, soalan-soalan asas ini akan tergantung di udara, dan anda melihat kebingungan yang ringan pada diri mereka. Bagi mereka, ini adalah kesilapan kategori.
Bahkan seorang penyelidik mengutip penilaian terkenal Dan Wang: berbanding dengan Amerika Syarikat yang dipimpin oleh peguam, China diperintah oleh jurutera. Semasa membincangkan isu-isu ini, beliau menggunakan perbandingan ini untuk menekankan keinginan mereka untuk membina. Di China, tidak ada jalan sistematik yang mampu membangunkan pengaruh bintang ilmuwan China sebagaimana podcast super popular seperti Dwarkesh atau Lex.
Saya mencuba untuk mendapat ulasan daripada saintis China mengenai ketidakpastian ekonomi masa depan yang disebabkan oleh AI, isu-isu yang melampaui kemampuan AGI yang mudah, atau perdebatan etika mengenai bagaimana model sepatutnya bertindak; semua soalan ini akhirnya memperlihatkan latar belakang dan pendidikan para saintis ini (sunting 1). Mereka sangat fokus pada kerja mereka, tetapi mereka tumbuh dalam sistem yang tidak mendorong perbincangan dan pernyataan mengenai bagaimana masyarakat seharusnya disusun dan diubah.
Dari sudut pandang yang lebih luas, terutama Beijing, kesan saya sangat mirip dengan Bay Area: sebuah laboratorium yang kompetitif, mungkin hanya beberapa menit berjalan kaki atau naik taksi jauhnya. Setelah mendarat, saya sempat mengunjungi kampus Beijing Alibaba dalam perjalanan ke hotel. Dalam 36 jam berikutnya, kami mengunjungi Zhipu AI, Moonshot AI, Universitas Tsinghua, Meituan, Xiaomi, dan 01.ai.
Di China, menggunakan DiDi sangat mudah. Jika anda memilih jenis kereta XL, anda sering akan diberikan kereta van elektrik kecil dengan kerusi urut. Kami bertanya kepada penyelidik mengenai peperangan merekrut bakat, dan mereka mengatakan ia sangat serupa dengan apa yang kami alami di Amerika Syarikat. Peralihan penyelidik adalah biasa, dan keputusan orang untuk pergi ke mana-mana sebahagian besar bergantung pada di mana suasana paling baik pada masa itu.
Di China, komuniti model bahasa besar terasa lebih seperti ekosistem berbanding suku-suku yang saling bertikai. Dalam banyak perbincangan tidak rasmi, saya hampir selalu mendengar rasa hormat terhadap rakan sekerja. Semua laboratorium China sangat menghormati ByteDance dan model Popcorn yang popular kerana ia adalah satu-satunya laboratorium tertutup terkemuka di China. Sementara itu, semua laboratorium sangat menghormati DeepSeek, dianggap sebagai laboratorium dengan selera penyelidikan paling tinggi dalam pelaksanaan. Di Amerika Syarikat, apabila anda berbincang secara tidak rasmi dengan ahli laboratorium, percikan sering kali segera muncul.
Yang paling saya kesan daripada sikap rendah hati penyelidik China ialah mereka sering mengangkat bahu dalam konteks perniagaan, mengatakan itu bukan masalah mereka. Di Amerika, kelihatan seperti setiap orang terperangkap dalam trend industri pada pelbagai peringkat ekosistem, dari penjual data, kepada kuasa pengiraan, hingga pembiayaan.
Perbezaan dan persamaan antara industri AI China dengan laboratorium Barat
Sekarang ini, membina model AI begitu menarik kerana ia bukan lagi sekadar mengumpulkan sekumpulan penyelidik cemerlang di dalam satu bangunan yang sama untuk bersama-sama mencipta satu keajaiban kejuruteraan. Dahulu memang lebih seperti itu, tetapi untuk mengekalkan perniagaan AI, model bahasa besar sedang berubah menjadi satu gabungan: ia melibatkan pembinaan, penghantaran, pembiayaan, serta mendorong pengambilan ciptaan ini.
Syarikat AI terkemuka wujud dalam ekosistem yang kompleks. Ekosistem ini menyediakan pendanaan, kuasa pengiraan, data, dan sumber tambahan untuk terus mendorong sempadan ke hadapan.
Dalam ekosistem barat, cara integrasi elemen-elemen yang diperlukan untuk mencipta dan mengekalkan model bahasa besar telah dikonseptualisasi dan dipetakan dengan cukup lengkap. Anthropic dan OpenAI adalah contoh klasik. Oleh itu, jika kita dapat mengesan perbezaan ketara dalam cara makmal China memikirkan isu-isu ini, kita boleh melihat perbezaan bermakna yang mungkin menjadi fokus pelaburan oleh syarikat-syarikat yang berbeza di masa depan. Tentu saja, masa depan-masa depan ini juga akan dipengaruhi kuat oleh sekatan pembiayaan dan/atau kuasa pengiraan.
Berikut adalah beberapa pendapatan utama "tahap industri AI" yang saya peroleh daripada perbincangan dengan makmal-makmal tersebut:
Pertama, permintaan AI di dalam negara telah menunjukkan tanda-tanda awal.
Satu anggapan yang banyak dibincangkan ialah pasaran AI China akan lebih kecil kerana syarikat-syarikat China biasanya tidak bersedia membayar untuk perisian, oleh itu tidak pernah dapat melepaskan pasaran inferens yang cukup besar untuk menyokong makmal.
Namun, penilaian ini hanya berlaku untuk perbelanjaan perisian yang sepadan dengan ekosistem SaaS. Ekosistem SaaS telah lama kecil dalam sejarah China. Di sisi lain, China jelas masih mempunyai pasaran awan yang besar.
Satu soalan penting yang belum dijawab ialah: perbelanjaan perusahaan China dalam AI akan lebih menyerupai pasaran SaaS, iaitu berskala kecil; atau lebih menyerupai pasaran awan, iaitu perbelanjaan asas. Soalan ini sedang dibincangkan di dalam laboratorium China sendiri. Secara keseluruhan, saya rasa AI sedang semakin mendekati pasaran awan, dan tiada siapa yang benar-benar bimbang bahawa pasaran yang terbentuk di sekitar alat baru tidak akan tumbuh.
Kedua, kebanyakan pembangun sangat dipengaruhi oleh Claude.
Walaupun Claude secara rasmi dilarang di China, kebanyakan pembangun AI di China sangat teruja terhadap Claude dan bagaimana ia mengubah cara mereka membina perisian. Hanya kerana China sebelum ini kurang bersedia untuk membeli perisian, tidak bermakna saya akan menganggap China tidak akan mengalami peningkatan besar dalam permintaan penalaran.
Teknisi China sangat praktikal, rendah hati, dan bermotivasi. Perasaan ini lebih kuat kepada saya daripada sebarang kebiasaan sejarah "tidak membayar untuk perisian".
Beberapa penyelidik China akan menyebut mereka menggunakan alat sendiri untuk membina, seperti alat baris arahan Kimi atau GLM, tetapi semua orang akan menyebut mereka menggunakan Claude. Secara mengejutkan, sedikit sekali yang menyebut Codex, padahal Codex jelas sedang menjadi popular dengan cepat di Wilayah Teluk.
Ketiga, syarikat China mempunyai sikap kepemilikan teknologi.
Budaya Cina sedang bergabung dengan enjin ekonomi yang beroperasi dengan kuat, menghasilkan beberapa kesan yang sukar diramalkan. Salah satu kesan mendalam yang saya tinggalkan ialah, bilangan besar model AI mencerminkan keseimbangan praktikal yang wujud di kalangan banyak perusahaan teknologi di sini. Tiada perancangan pusat yang ada.
Industri ini didefinisikan oleh penghormatan terhadap ByteDance dan Alibaba. Mereka dianggap sebagai pemain besar yang akan memenangi banyak pasaran dengan sumber daya yang kuat. DeepSeek adalah pemimpin teknologi yang dihormati, tetapi jauh dari menjadi pemimpin pasaran. Mereka menetapkan arah, tetapi tidak memiliki struktur yang mampu memenangi pasaran secara ekonomi.
Ini meninggalkan syarikat-syarikat seperti Meituan atau Ant Group. Orang Barat mungkin terkejut mengapa mereka juga membina model-model ini. Namun sebenarnya, mereka jelas memandang model bahasa besar sebagai inti produk teknologi masa depan, oleh itu mereka memerlukan asas yang kuat.
Apabila mereka menyesuaikan model universal yang kuat, umpan balik dari komuniti sumber terbuka terhadap model tersebut akan memperkuat teknologi mereka, sambil membolehkan mereka menyimpan versi penyesuaian dalaman untuk produk mereka sendiri. Sikap "terbuka terlebih dahulu" dalam industri ini sebahagian besarnya ditakrifkan oleh pragmatisme: ia membantu model mendapatkan umpan balik yang kuat, memberi balik kepada komuniti sumber terbuka, dan memperkuat misi mereka sendiri.
Keempat, sokongan kerajaan adalah nyata, tetapi skala masih tidak jelas.
Orang sering menyatakan bahawa kerajaan China sedang secara aktif membantu membuka persaingan model bahasa besar. Namun, ini adalah sistem kerajaan yang relatif terdesentralisasi dengan banyak peringkat, dan setiap peringkat tidak mempunyai panduan operasi yang jelas yang menentukan apa yang sepatutnya mereka lakukan.
Antara kawasan-kawasan berbeza di Beijing terdapat persaingan untuk menarik syarikat teknologi membuka pejabat di kawasan mereka. “Bantuan” yang diberikan kepada syarikat-syarikat ini hampir pasti termasuk penghapusan prosedur birokrasi seperti lesen. Tetapi sejauh manakah bantuan ini boleh berkesan? Tahap-tahap kerajaan yang berbeza mampukah membantu menarik tenaga kerja? Mampukah mereka membantu menyeludupkan cip?
Sepanjang perjalanan ini, memang terdapat banyak penyebutan mengenai minat atau bantuan kerajaan, tetapi maklumat yang berkaitan jauh dari mencukupi untuk saya melaporkan butiran secara tegas, atau untuk membentuk pandangan dunia yang percaya diri mengenai bagaimana kerajaan sebenarnya boleh mengubah lintasan perkembangan AI di China.
Tentu, tiada tanda sama sekali bahawa pimpinan tertinggi kerajaan China mempengaruhi sebarang keputusan teknikal model.
Kelima, industri data jauh kurang maju berbanding Barat.
Kami sebelumnya mendengar bahawa Anthropic atau OpenAI menghabiskan lebih daripada 10 juta dolar AS untuk satu persekitaran sahaja, dengan jumlah perbelanjaan tahunan untuk mendorong hadapan pembelajaran penguatan mencapai berbilion dolar AS. Oleh itu, kami sangat ingin tahu sama ada makmal China juga membeli persekitaran yang sama daripada syarikat-syarikat Amerika, atau adakah ekosistem domestik yang serupa menyokong mereka.
Jawapannya bukanlah “tiada industri data” dalam erti kata penuh, tetapi berdasarkan pengalaman mereka, kualiti industri data relatif rendah, oleh itu sering kali lebih baik untuk membina persekitaran atau data sendiri. Penyelidik sendiri akan menghabiskan banyak masa untuk membina persekitaran latihan pembelajaran penguatan, manakala syarikat besar seperti ByteDance dan Alibaba boleh memiliki pasukan penandaan data dalaman untuk menyokong perkara ini. Semua ini menyokong sikap “bina sendiri, bukan beli” yang disebutkan sebelum ini.
Keen demand for more NVIDIA chips.
Kekuatan komputasi NVIDIA adalah standard emas untuk pelatihan, dan kemajuan setiap orang dibatasi oleh kurangnya kekuatan komputasi tambahan. Jika bekalan mencukupi, jelas mereka akan membeli. Accelerator lain, termasuk tetapi tidak terhadap Huawei, telah menerima ulasan positif dalam inferens. Banyak laboratorium boleh menggunakan cip Huawei.
Poin-poin ini menggambarkan ekosistem AI yang sangat berbeza. Mengaplikasikan cara kerja laboratorium Barat secara pantas kepada rakan sebaya China sering kali mengakibatkan kesilapan kategori. Masalah utama ialah sama ada ekosistem yang berbeza ini akan menghasilkan jenis model yang berbeza secara substantif; atau sama ada model China sentiasa ditafsirkan sebagai serupa dengan model terkini Amerika yang berlaku 3 hingga 9 bulan yang lalu.
Kesimpulan: Keseimbangan global
Sebelum perjalanan ini, saya memahami China terlalu sedikit; dan ketika pergi, saya merasa baru saja mulai belajar. China bukanlah tempat yang dapat dijelaskan dengan peraturan atau resep, tetapi tempat dengan mekanisme dan reaksi kimia yang sangat berbeda. Budayanya sangat kuno, sangat mendalam, dan masih sepenuhnya terjalin dengan cara pembangunan teknologi di dalam negeri. Saya masih memiliki banyak hal yang perlu pelajari.
Banyak komponen dalam struktur kekuasaan semasa di Amerika Syarikat menjadikan pandangan mereka terhadap China sebagai alat psikologi utama dalam pengambilan keputusan. Selepas berbincang secara rasmi atau tidak rasmi dengan hampir setiap laboratorium AI terkemuka di China, saya mendapati bahawa China mempunyai banyak ciri dan naluri yang sukar dimodelkan oleh cara pengambilan keputusan Barat.
Walaupun saya secara langsung bertanya kepada laboratorium-laboratorium ini mengapa mereka membuka dan mempublikasikan model terkuat mereka, saya masih sukar untuk sepenuhnya menghubungkan "mentaliti kepemilikan" dengan "sokongan tulus terhadap ekosistem".
Lab di sini sangat praktikal, bukanlah absolutis dalam hal sumber terbuka, dan tidak semua model yang mereka bangun akan dirilis secara terbuka. Namun, mereka memiliki niat yang mendalam dalam menyokong pembangun, menyokong ekosistem, serta menjadikan keterbukaan sebagai cara untuk memahami model mereka sendiri lebih lanjut.
Hampir setiap syarikat teknologi besar China sedang membina model bahasa besar umum sendiri. Kita telah melihat bahawa syarikat perkhidmatan platform seperti Meituan dan syarikat teknologi pengguna besar seperti Xiaomi telah menerbitkan model dengan bobot terbuka. Syarikat sejenis di Amerika biasanya hanya akan membeli perkhidmatan.
Syarikat-syarikat ini membina model bahasa besar bukan sekadar untuk menonjolkan kehadiran mereka dalam perkara baru yang popular, tetapi kerana hasrat yang mendalam dan asas: mengawal teknologi mereka sendiri dan membangunkan teknologi paling penting semasa ini. Apabila saya mengangkat kepala dari komputer riba, saya selalu dapat melihat rangkaian cranes di cakrawala, yang jelas selari dengan budaya dan tenaga pembinaan yang lebih luas di China.
Orang-orang penyelidik China membawa rasa kemanusiaan, daya tarik, dan kehangatan tulus yang sangat membangkitkan perasaan akrab. Secara peribadi, perbincangan geopolitik kejam yang biasa kita alami di Amerika sama sekali tidak meresap ke dalam diri mereka. Dunia ini boleh memiliki lebih banyak positiviti ringan seperti ini. Sebagai sebahagian daripada komuniti AI, kini saya lebih bimbang bahawa retakan sedang muncul di antara ahli dan kumpulan berdasarkan label kewarganegaraan.
Jika saya mengatakan saya tidak ingin laboratorium Amerika menjadi pemimpin yang jelas di setiap bahagian tumpukan teknologi AI, itu adalah kebohongan. Terutama di bidang model terbuka yang saya curahkan banyak masa, saya orang Amerika, dan ini adalah preferensi yang jujur.
Sambil itu, saya berharap ekosistem terbuka itu sendiri dapat berkembang pesat secara global, kerana ia dapat menciptakan AI yang lebih selamat, lebih boleh diakses, dan lebih berguna untuk dunia. Masalah semasa ialah, adakah makmal Amerika akan mengambil tindakan untuk mengambil posisi kepimpinan ini.
Semasa saya menulis artikel ini, lebih banyak desas-desus sedang beredar mengenai kesan perintah pentadbiran terhadap model terbuka. Ini mungkin akan memperumit lagi hubungan kolaboratif antara kepimpinan Amerika Syarikat dan ekosistem global—ini tidak membuat saya lebih yakin.
Terima kasih kepada semua individu hebat yang telah saya berbincang dengan di Moonshot, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Group Lingguang, 01.ai, dan institusi lainnya. Setiap orang sangat bersemangat dan begitu murah hati meluangkan masa mereka. Seiring idea saya semakin jelas, saya akan terus berkongsi pemerhatian mengenai China, termasuk aspek budaya yang lebih luas serta bidang AI itu sendiri.
Jelas bahawa pengetahuan ini akan berkaitan secara langsung dengan cerita yang sedang berkembang mengenai perkembangan terkini AI.
Klik untuk mengetahui jawatan yang sedang dibuka oleh BlockBeats
Selamat datang ke komuniti rasmi律动 BlockBeats:
Kumpulan langgan Telegram: https://t.me/theblockbeats
Kumpulan perbincangan Telegram: https://t.me/BlockBeats_App
Akaun rasmi Twitter: https://twitter.com/BlockBeatsAsia
