Catatan editor: Laboratorium AI Tiongkok sedang menjadi kekuatan yang semakin sulit diabaikan dalam persaingan model besar global. Keunggulan mereka tidak hanya terletak pada jumlah sumber daya manusia yang banyak, kemampuan teknis yang kuat, dan kecepatan iterasi yang tinggi, tetapi juga pada pendekatan organisasi yang sangat pragmatis: lebih sedikit membahas konsep, lebih banyak membuat model; lebih sedikit menekankan bintang individu, lebih banyak menekankan eksekusi tim; lebih sedikit bergantung pada layanan eksternal, dan lebih cenderung menguasai tumpukan teknologi inti sendiri.
Setelah mengunjungi sejumlah laboratorium AI terkemuka di Tiongkok, penulis artikel ini, Nathan Lambert, menemukan bahwa ekosistem AI Tiongkok tidak sepenuhnya sama dengan Amerika Serikat. Amerika lebih menekankan pada paradigma orisinal, investasi modal, dan pengaruh pribadi ilmuwan puncak; sementara Tiongkok lebih unggul dalam mengejar cepat di bidang yang sudah ada, dengan memanfaatkan sumber terbuka, optimasi teknik, dan kontribusi besar dari sejumlah peneliti muda untuk segera mendorong kemampuan model ke garis depan.
Yang paling patut diperhatikan bukanlah apakah AI Tiongkok telah melampaui AS, melainkan dua jalur pengembangan yang berbeda sedang terbentuk: AS lebih mirip perlombaan mutakhir yang didorong oleh modal dan laboratorium bintang, sementara Tiongkok lebih mirip perlombaan industri yang didorong oleh kemampuan teknik, ekosistem open-source, dan kesadaran akan kendali teknologi sendiri.
Ini berarti bahwa persaingan AI di masa depan tidak hanya akan menjadi pertarungan di peringkat model, tetapi juga dalam hal kemampuan organisasi, ekosistem pengembang, dan eksekusi industri. Perubahan sejati dalam AI Tiongkok terletak pada fakta bahwa ia tidak lagi sekadar meniru Silicon Valley, melainkan berpartisipasi dalam frontier global dengan cara sendiri.
Berikut adalah teks aslinya:
Duduk di kereta api berkecepatan tinggi modern yang berangkat dari Hangzhou menuju Shanghai, saya menatap keluar jendela, melihat punggung pegunungan yang jelas berombak, dengan turbin angin tersebar di atasnya, membentuk siluet di bawah cahaya matahari terbenam. Pegunungan membentuk latar belakang, sementara di depan mata saya terhampar ladang luas dan gedung-gedung tinggi yang saling berselang-seling.
Saya kembali dari Tiongkok dengan kerendahan hati yang besar. Mengunjungi tempat yang begitu asing namun disambut dengan hangat, merupakan pengalaman yang sangat hangat dan penuh kemanusiaan. Saya berkesempatan bertemu banyak orang di ekosistem AI yang sebelumnya hanya saya kenal dari jauh; dan mereka menyambut saya dengan senyuman cerah dan antusiasme, membuat saya kembali menyadari bahwa pekerjaan saya serta seluruh ekosistem AI itu sendiri bersifat global.
Mindset of Chinese researchers
Perusahaan China yang sedang membangun model bahasa dapat dikatakan sangat cocok menjadi "pengikut cepat" dalam teknologi ini. Mereka didasarkan pada tradisi budaya pendidikan dan kerja yang telah lama ada di China, sekaligus memiliki cara membangun perusahaan teknologi yang sedikit berbeda dari Barat.
Jika hanya melihat output, yaitu model terbaru dan terbesar, serta alur kerja agen yang didukung oleh model-model tersebut; serta melihat elemen masukan seperti ilmuwan unggul, data skala besar, dan sumber daya komputasi akselerasi, maka laboratorium Tiongkok dan laboratorium Amerika tampak secara keseluruhan serupa. Perbedaan yang benar-benar bertahan jangka panjang muncul dalam bagaimana elemen-elemen ini diorganisasi dan dibentuk.
Saya selalu berpikir bahwa salah satu alasan mengapa laboratorium di Tiongkok sangat ahli dalam mengejar dan tetap berada di garis depan adalah karena budaya mereka sangat cocok dengan tugas ini. Namun, sebelum berinteraksi langsung dengan orang-orangnya, saya merasa tidak pantas mengaitkan intuisi ini dengan pengaruh yang signifikan. Setelah berbicara dengan banyak ilmuwan hebat, rendah hati, dan terbuka di laboratorium terkemuka Tiongkok, banyak pemikiran saya menjadi lebih jelas.
Membangun model bahasa besar terbaik hari ini sangat bergantung pada pekerjaan teliti yang melintasi seluruh tumpukan teknologi: dari data, detail arsitektur, hingga implementasi algoritma pembelajaran penguatan. Setiap bagian model berpotensi memberikan peningkatan, dan cara menggabungkan peningkatan-peningkatan ini merupakan proses yang kompleks. Dalam proses ini, pekerjaan yang dilakukan oleh beberapa individu sangat cerdas mungkin harus ditunda agar model keseluruhan dapat mencapai optimalisasi maksimal dalam multi-target optimization.
Peneliti Amerika jelas sangat ahli dalam menyelesaikan masalah komponen tunggal, tetapi Amerika memiliki budaya yang lebih kuat untuk "berbicara untuk diri sendiri". Sebagai ilmuwan, ketika Anda secara aktif memperjuangkan perhatian untuk pekerjaan Anda, Anda cenderung lebih sukses; dan budaya kontemporer sedang mendorong jalur ketenaran baru, yaitu menjadi "ilmuwan AI puncak". Ini akan menimbulkan konflik langsung.
Secara luas beredar kabar bahwa organisasi Llama runtuh setelah permintaan kepentingan ini diintegrasikan ke dalam struktur hierarkis karena tekanan politik. Saya juga pernah mendengar dari laboratorium lain bahwa terkadang diperlukan untuk “menenangkan” seorang peneliti puncak agar berhenti mengeluh bahwa ide mereka tidak dimasukkan ke dalam model akhir. Terlepas dari apakah ini sepenuhnya benar atau tidak, maknanya jelas: kesadaran diri dan keinginan untuk kemajuan karier memang dapat menghambat orang-orang dalam membangun model terbaik. Bahkan perbedaan budaya kecil antara Amerika Serikat dan Tiongkok pun dapat berdampak signifikan terhadap hasil akhir.
Sebagian dari perbedaan ini terkait dengan siapa yang membangun model-model ini di Tiongkok. Di semua laboratorium, kenyataan yang sangat jelas adalah: sebagian besar kontributor utama masih merupakan mahasiswa. Laboratorium-laboratorium ini cukup muda, yang mengingatkan saya pada cara kami mengorganisasi di Ai2: mahasiswa dianggap sebagai rekan dan secara langsung diintegrasikan ke dalam tim model bahasa besar.
Ini sangat berbeda dengan laboratorium terkemuka di Amerika. Di Amerika, perusahaan-perusahaan seperti OpenAI, Anthropic, dan Cursor sama sekali tidak menyediakan kesempatan magang. Perusahaan lain seperti Google secara resmi menawarkan magang terkait Gemini, tetapi banyak orang khawatir apakah magang mereka akan diisolasi dari pekerjaan inti yang sebenarnya.
Secara ringkas, perbedaan budaya ringan ini dapat meningkatkan kemampuan pembangunan model dengan cara berikut: untuk meningkatkan model akhir, orang lebih bersedia melakukan pekerjaan yang kurang glamor; individu yang baru mulai terlibat dalam pembangunan AI mungkin tidak terpengaruh oleh siklus spekulasi AI sebelumnya, sehingga dapat lebih cepat beradaptasi dengan metode teknis modern baru. Faktanya, seorang ilmuwan Tiongkok yang saya ajak bicara secara jelas memandang hal ini sebagai keunggulan; kesadaran diri yang lebih rendah membuat struktur organisasi lebih mudah diperluas karena orang cenderung kurang berusaha "memanipulasi sistem"; sejumlah besar bakat sangat cocok untuk menyelesaikan masalah yang sudah memiliki bukti konsep di tempat lain, dll.
Tendensi ini lebih mendukung kemampuan model bahasa saat ini, yang bertentangan dengan stereotip yang sudah dikenal: orang sering menganggap bahwa peneliti Tiongkok lebih sedikit menghasilkan penelitian akademis bersifat kreatif dan mampu membuka bidang baru, yaitu penelitian “dari 0 ke 1”.
Dalam beberapa kunjungan laboratorium yang lebih bersifat akademis selama perjalanan ini, banyak pemimpin membahas bahwa mereka sedang membangun budaya penelitian yang lebih ambisius. Sementara itu, beberapa pemimpin teknis yang kami ajak bicara meragukan apakah重塑 cara ilmu pengetahuan ini mungkin terwujud dalam jangka pendek, karena memerlukan desain ulang sistem pendidikan dan sistem insentif, yang merupakan perubahan terlalu besar untuk terjadi dalam keseimbangan ekonomi saat ini.
Budaya ini tampaknya sedang melatih sekelompok besar siswa dan insinyur yang sangat ahli dalam "membangun permainan model bahasa besar". Tentu saja, jumlah mereka juga sangat banyak.
Para siswa ini memberi tahu saya bahwa hal serupa dengan yang terjadi di Amerika juga sedang terjadi di Tiongkok: banyak orang yang sebelumnya mempertimbangkan jalur akademis kini berniat tetap di sektor industri. Kalimat paling menarik datang dari seorang peneliti yang awalnya ingin menjadi profesor, yang mengatakan bahwa ia ingin menjadi profesor karena ingin dekat dengan sistem pendidikan; namun ia kemudian menambahkan bahwa pendidikan telah diselesaikan oleh model bahasa besar—“Mengapa siswa masih perlu datang berbicara dengan saya!”
Siswa-siswa memasuki bidang large language model dengan pandangan segar, yang merupakan keunggulan. Dalam beberapa tahun terakhir, kami melihat paradigma kunci large language model terus berubah: dari ekspansi MoE, hingga ekspansi reinforcement learning, hingga dukungan agen. Untuk berhasil melakukan salah satu hal ini, diperlukan kemampuan menyerap informasi latar belakang dalam jumlah besar dengan sangat cepat, baik dari literatur yang lebih luas maupun dari teknologi stack internal perusahaan.
Siswa terbiasa melakukan hal-hal semacam ini dan bersedia meletakkan semua asumsi mereka tentang "apa yang seharusnya efektif" dengan sikap rendah hati. Mereka langsung terjun ke dalamnya, menginvestasikan hidup mereka hanya untuk mendapatkan kesempatan memperbaiki model.
Siswa-siswa ini juga sangat langsung dan tanpa percakapan filosofis yang bisa mengalihkan perhatian para ilmuwan. Ketika saya bertanya tentang pandangan mereka terhadap dampak ekonomi model atau risiko sosial jangka panjang, terdapat jauh lebih sedikit peneliti Tiongkok yang memiliki pandangan kompleks dan ingin memberikan pengaruh pada isu-isu ini. Mereka percaya peran mereka hanyalah membangun model terbaik.
Perbedaan ini halus dan mudah ditolak. Namun, ia paling mudah dirasakan ketika Anda berbincang lama dengan seorang peneliti yang anggun, cerdas, dan mampu menyampaikan gagasan dengan jelas dalam bahasa Inggris: ketika Anda menanyakan pertanyaan-pertanyaan filosofis yang lebih dalam tentang AI, pertanyaan-pertanyaan dasar ini menggantung di udara, dan sang lawan bicara menunjukkan kebingungan sederhana. Bagi mereka, ini adalah kesalahan kategori.
Bahkan seorang peneliti mengutip pernyataan terkenal Dan Wang: dibandingkan Amerika Serikat yang dipimpin oleh pengacara, Tiongkok dikelola oleh insinyur. Dalam membahas masalah-masalah ini, ia menggunakan analogi ini untuk menekankan keinginan mereka untuk membangun. Di Tiongkok, tidak ada jalur sistematis yang dapat membentuk pengaruh bintang ilmuwan Tiongkok sebagaimana dilakukan oleh podcast superpopuler seperti Dwarkesh atau Lex.
Saya mencoba meminta para ilmuwan Tiongkok mengomentari ketidakpastian ekonomi masa depan yang disebabkan oleh AI, masalah yang melampaui kemampuan AGI sederhana, atau perdebatan etis tentang bagaimana model seharusnya berperilaku; semua pertanyaan ini pada akhirnya membuat saya melihat latar belakang pertumbuhan dan pendidikan para ilmuwan ini (sudah diedit). Mereka sangat fokus pada pekerjaan mereka, tetapi mereka tumbuh dalam sistem yang tidak mendorong diskusi dan ekspresi tentang bagaimana masyarakat seharusnya diorganisasi atau diubah.
Dari sudut pandang yang lebih luas, terutama Beijing, kesan saya sangat mirip dengan Bay Area: sebuah laboratorium yang kompetitif, yang mungkin hanya berjarak beberapa menit berjalan kaki atau naik taksi. Setelah mendarat, saya sempat mengunjungi kampus Beijing Alibaba dalam perjalanan ke hotel. Dalam 36 jam berikutnya, kami mengunjungi Zhipu AI, Moonshot AI, Tsinghua University, Meituan, Xiaomi, dan 01.ai.
Di Tiongkok, menggunakan DiDi sangat nyaman. Jika Anda memilih jenis kendaraan XL, seringkali Anda akan diberikan mobil van listrik kecil dengan kursi pijat. Kami bertanya kepada para peneliti tentang perang merekrut bakat, dan mereka mengatakan hal ini sangat mirip dengan yang kami alami di Amerika Serikat. Pindahnya peneliti adalah hal biasa, dan orang-orang memilih ke mana mereka pergi sebagian besar bergantung pada lingkungan terbaik saat ini.
Di Tiongkok, komunitas model bahasa besar terasa lebih seperti sebuah ekosistem daripada suku-suku yang saling bertikai. Dalam banyak percakapan tidak resmi, saya hampir selalu mendengar rasa hormat terhadap rekan-rekan sejawat. Semua laboratorium Tiongkok sangat menghormati ByteDance dan model populer Doubao-nya, karena itu adalah satu-satunya laboratorium tertutup terdepan di Tiongkok. Sementara itu, semua laboratorium sangat menghormati DeepSeek, dianggap sebagai laboratorium dengan selera penelitian paling tinggi dalam hal eksekusi. Di Amerika Serikat, ketika Anda berbicara secara tidak resmi dengan anggota laboratorium, percikan sering kali langsung muncul.
Yang paling mengesankan saya dari sikap rendah hati peneliti Tiongkok adalah bahwa mereka sering mengangkat bahu secara bisnis, mengatakan bahwa itu bukan masalah mereka. Di Amerika Serikat, tampaknya setiap orang terobsesi dengan tren industri di berbagai tingkat ekosistem, mulai dari penjual data, hingga daya komputasi, hingga pendanaan.
Perbedaan dan persamaan antara industri AI Tiongkok dan laboratorium Barat
Saat ini, membuat model AI begitu menarik karena ini bukan lagi sekadar mengumpulkan sekelompok peneliti hebat di satu gedung yang sama untuk bersama-sama menciptakan keajaiban teknik. Dulu memang lebih seperti itu, tetapi untuk mempertahankan bisnis AI, model bahasa besar kini berubah menjadi sesuatu yang hibrida: melibatkan pembangunan, peluncuran, pendanaan, serta mendorong adopsi dari ciptaan ini.
Perusahaan AI terkemuka ada dalam ekosistem yang kompleks. Ekosistem ini menyediakan pendanaan, daya komputasi, data, dan sumber daya lainnya untuk terus mendorong batas-batas terdepan.
Dalam ekosistem Barat, cara mengintegrasikan berbagai elemen yang diperlukan untuk menciptakan dan mempertahankan model bahasa besar telah相对充分地概念化 dan dipetakan. Anthropic dan OpenAI adalah contoh khas. Oleh karena itu, jika kita dapat menemukan bahwa laboratorium Tiongkok memiliki cara berpikir yang berbeda secara signifikan terhadap masalah-masalah ini, kita dapat melihat perbedaan bermakna apa yang mungkin menjadi fokus masa depan perusahaan-perusahaan tersebut. Tentu saja, masa depan-masa depan ini juga akan sangat dipengaruhi oleh kendala pendanaan dan/atau daya komputasi.
Berikut adalah beberapa pelajaran utama di tingkat industri "AI" yang saya rangkum setelah berdiskusi dengan laboratorium-laboratorium tersebut:
Pertama, permintaan AI domestik telah menunjukkan tanda-tanda awal.
Ada asumsi yang banyak dibahas bahwa pasar AI Tiongkok akan lebih kecil, karena perusahaan Tiongkok biasanya tidak mau membayar untuk perangkat lunak, sehingga tidak pernah dapat melepaskan pasar inferensi yang cukup besar untuk mendukung laboratorium.
Namun, penilaian ini hanya berlaku untuk pengeluaran perangkat lunak yang sesuai dengan ekosistem SaaS. Ekosistem SaaS secara historis selalu kecil di Tiongkok. Di sisi lain, Tiongkok jelas masih memiliki pasar cloud yang besar.
Pertanyaan penting yang belum terjawab adalah: pengeluaran perusahaan China di bidang AI akan lebih mirip pasar SaaS, yang berukuran lebih kecil; atau lebih mirip pasar cloud, yang bersifat fundamental. Pertanyaan ini bahkan sedang dibahas di dalam laboratorium China sendiri. Secara keseluruhan, saya merasa AI sedang semakin mendekati pasar cloud, dan tidak ada yang benar-benar khawatir bahwa pasar yang terbentuk di sekitar alat-alat baru tidak akan tumbuh.
Kedua, sebagian besar pengembang sangat terpengaruh oleh Claude.
Meskipun Claude secara resmi dilarang di Tiongkok, sebagian besar pengembang AI di Tiongkok sangat terkesan dengan Claude dan bagaimana ia mengubah cara mereka membangun perangkat lunak. Hanya karena Tiongkok sebelumnya kurang bersedia membeli perangkat lunak, tidak berarti saya menganggap Tiongkok tidak akan mengalami lonjakan besar dalam permintaan inferensi.
Teknisi Tiongkok sangat praktis, rendah hati, dan penuh motivasi. Hal ini memberi saya kesan yang lebih kuat daripada kebiasaan sejarah mana pun terkait "tidak membayar perangkat lunak".
Beberapa peneliti Tiongkok menyebutkan bahwa mereka menggunakan alat mereka sendiri untuk membangun, seperti alat baris perintah Kimi atau GLM, tetapi semua orang menyebutkan bahwa mereka menggunakan Claude. Yang mengejutkan, sangat sedikit yang menyebut Codex, padahal Codex jelas sedang cepat populer di Bay Area.
Ketiga, perusahaan Tiongkok memiliki sikap kepemilikan teknologi.
Budaya Tiongkok sedang bergabung dengan mesin ekonomi yang berjalan keras, menghasilkan beberapa hasil yang sulit diprediksi. Salah satu kesan mendalam yang saya dapatkan adalah, jumlah besar model AI mencerminkan keseimbangan pragmatis yang dimiliki banyak perusahaan teknologi di sini. Tidak ada rencana terpadu.
Industri ini didefinisikan oleh rasa hormat terhadap ByteDance dan Alibaba. Mereka dianggap sebagai pemain besar yang akan memenangkan banyak pasar berkat sumber daya kuat mereka. DeepSeek adalah pemimpin teknologi yang dihormati, tetapi jauh dari menjadi pemimpin pasar. Mereka menetapkan arah, tetapi tidak memiliki struktur yang mampu memenangkan pasar secara ekonomi.
Ini meninggalkan perusahaan-perusahaan seperti Meituan atau Ant Group. Orang Barat mungkin terkejut mengapa mereka juga membangun model-model ini. Namun sebenarnya, mereka jelas memandang model bahasa besar sebagai inti dari produk teknologi masa depan, sehingga mereka membutuhkan dasar yang kuat.
Ketika mereka melakukan fine-tuning terhadap model universal yang kuat, umpan balik dari komunitas open-source terhadap model tersebut akan memperkuat teknologi mereka, sekaligus memungkinkan mereka menyimpan versi fine-tuning internal untuk produk mereka sendiri. Sikap "open-first" dalam industri ini sebagian besar didefinisikan oleh pragmatisme: hal ini membantu model mendapatkan umpan balik yang kuat, memberikan kontribusi kembali kepada komunitas open-source, serta mendukung misi mereka sendiri.
Keempat, dukungan pemerintah memang nyata, tetapi skalanya belum jelas.
Orang sering mengklaim bahwa pemerintah Tiongkok secara aktif membantu membuka kompetisi model bahasa besar. Namun, ini adalah sistem pemerintahan yang relatif terdesentralisasi dengan banyak tingkatan, dan setiap tingkatan tidak memiliki panduan operasional yang jelas tentang apa yang seharusnya mereka lakukan.
Antar lingkungan di Beijing saling bersaing untuk menarik perusahaan teknologi agar menempatkan kantor mereka di wilayah tersebut. “Bantuan” yang diberikan kepada perusahaan-perusahaan ini hampir pasti mencakup penghapusan birokrasi seperti prosedur lisensi. Tetapi sejauh mana bantuan ini dapat berjalan? Apakah berbagai tingkatan pemerintah dapat membantu menarik tenaga ahli? Apakah mereka dapat membantu menyelundupkan chip?
Selama seluruh kunjungan, memang ada banyak penyebutan mengenai minat atau bantuan pemerintah, tetapi informasi terkait jauh dari cukup untuk saya melaporkan detail secara tegas, maupun untuk membentuk pandangan dunia yang percaya diri mengenai bagaimana pemerintah sebenarnya dapat mengubah jalur perkembangan AI di Tiongkok.
Tentu, sama sekali tidak ada indikasi bahwa tingkat tertinggi pemerintah Tiongkok memengaruhi keputusan teknis apa pun dari model ini.
Kelima, industri data jauh kalah berkembang dibandingkan Barat.
Kami sebelumnya mendengar bahwa Anthropic atau OpenAI menghabiskan lebih dari $10 juta untuk satu lingkungan saja, dengan total pengeluaran tahunan mencapai ratusan juta dolar untuk mendorong batas-batas pembelajaran penguatan. Oleh karena itu, kami sangat ingin tahu apakah laboratorium di Tiongkok juga membeli lingkungan yang sama dari perusahaan-perusahaan Amerika, atau apakah ada ekosistem domestik yang menjadi cerminan yang mendukung mereka.
Jawabannya bukan berarti "tidak ada industri data" dalam arti penuh, tetapi berdasarkan pengalaman mereka, kualitas industri data relatif rendah, sehingga seringkali lebih baik untuk membangun lingkungan atau data secara internal. Peneliti sendiri akan menghabiskan banyak waktu untuk membuat lingkungan pelatihan reinforcement learning, sementara perusahaan besar seperti ByteDance dan Alibaba dapat memiliki tim pelabelan data internal untuk mendukung hal ini. Semua ini selaras dengan sikap "membangun sendiri daripada membeli" yang telah disebutkan sebelumnya.
Keen demand for more NVIDIA chips.
Kekuatan komputasi NVIDIA adalah standar emas untuk pelatihan, dan kemajuan setiap orang dibatasi oleh kurangnya kekuatan komputasi tambahan. Jika pasokan mencukupi, jelas mereka akan membelinya. Accelerator lainnya, termasuk tetapi tidak terbatas pada Huawei, menerima evaluasi positif dalam hal inferensi. Banyak laboratorium dapat menggunakan chip Huawei.
Poin-poin ini menggambarkan ekosistem AI yang sangat berbeda. Menerapkan cara kerja laboratorium Barat secara cepat pada rekan-rekan Tiongkok sering kali menghasilkan kesalahan kategori. Pertanyaan kuncinya adalah, apakah ekosistem-ekosistem yang berbeda ini akan menghasilkan jenis model yang secara substansial berbeda; atau apakah model-model Tiongkok selalu akan diinterpretasikan sebagai serupa dengan model mutakhir Amerika yang berusia 3 hingga 9 bulan yang lalu.
Kesimpulan: Keseimbangan global
Sebelum perjalanan ini, saya sangat sedikit mengetahui tentang Tiongkok; dan ketika pergi, saya merasa baru saja mulai belajar. Tiongkok bukanlah tempat yang bisa dijelaskan dengan aturan atau resep, melainkan tempat dengan mekanisme dan reaksi kimia yang sangat berbeda. Budayanya sangat kuno, sangat dalam, dan masih sepenuhnya terjalin dengan cara pembangunan teknologi di dalam negeri. Saya masih memiliki banyak hal yang perlu pelajari.
Banyak bagian dari struktur kekuasaan AS saat ini menjadikan pandangan mereka terhadap Tiongkok sebagai alat psikologis kunci dalam pengambilan keputusan. Setelah melakukan pertemuan langsung, baik formal maupun informal, dengan hampir setiap laboratorium AI terkemuka di Tiongkok, saya menemukan bahwa Tiongkok memiliki banyak kualitas dan naluri yang sulit dimodelkan oleh pendekatan pengambilan keputusan Barat.
Meskipun saya secara langsung menanyakan mengapa laboratorium ini membuka rilis model terkuat mereka, saya tetap kesulitan untuk sepenuhnya menghubungkan "mentalitas kepemilikan" dengan "dukungan tulus terhadap ekosistem".
Laboratorium di sini sangat pragmatis, bukan absolutis dalam hal open source, dan tidak semua model yang mereka bangun dirilis secara terbuka. Namun, mereka memiliki niat yang kuat dalam mendukung pengembang, mendukung ekosistem, serta menjadikan keterbukaan sebagai cara untuk memahami model mereka sendiri lebih dalam.
Hampir setiap perusahaan teknologi besar Tiongkok sedang membangun model bahasa besar umum mereka sendiri. Kita telah melihat bahwa perusahaan layanan platform seperti Meituan dan perusahaan teknologi konsumen besar seperti Xiaomi telah merilis model dengan bobot terbuka. Perusahaan sejenis di Amerika biasanya hanya akan membeli layanan.
Perusahaan-perusahaan ini membangun model bahasa besar bukan demi menarik perhatian pada hal-hal baru yang sedang tren, tetapi karena hasrat mendalam dan mendasar: mengendalikan teknologi stack mereka sendiri dan mengembangkan teknologi paling penting saat ini. Ketika saya mengangkat pandangan dari laptop saya, saya selalu melihat kelompok-kelompok crane di cakrawala, yang jelas selaras dengan budaya dan energi konstruksi yang lebih luas di Tiongkok.
Kehangatan, pesona, dan ketulusan para peneliti Tiongkok sangat membuat orang merasa dekat. Secara pribadi, diskusi geopolitik kejam yang biasa kita alami di Amerika sama sekali tidak menembus mereka. Dunia ini membutuhkan lebih banyak sikap positif sederhana seperti ini. Sebagai anggota komunitas AI, kini saya lebih khawatir bahwa retakan sedang muncul di antara anggota dan kelompok karena label kewarganegaraan.
Jika saya mengatakan bahwa saya tidak ingin laboratorium AS menjadi pemimpin yang jelas di setiap bagian tumpukan teknologi AI, itu adalah kebohongan. Terutama di bidang model terbuka yang telah saya habiskan banyak waktu, saya orang Amerika, ini adalah preferensi yang jujur.
Sementara itu, saya berharap ekosistem terbuka itu sendiri dapat berkembang pesat secara global, karena hal ini dapat menciptakan AI yang lebih aman, lebih dapat diakses, dan lebih bermanfaat bagi dunia. Namun, masalah saat ini adalah apakah laboratorium Amerika akan mengambil tindakan untuk mempertahankan posisi kepemimpinan ini.
Saat saya menyelesaikan artikel ini, lebih banyak desas-desus beredar mengenai dampak perintah administratif terhadap model terbuka. Ini dapat semakin memperumit sinergi antara kepemimpinan Amerika Serikat dan ekosistem global—hal ini tidak membuat saya lebih percaya diri.
Terima kasih kepada semua orang luar biasa yang telah saya ajak berbicara di Moonshot, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai, dan lembaga lainnya. Setiap orang sangat antusias dan dengan murah hati meluangkan waktu mereka. Seiring ide-ide saya semakin jelas, saya akan terus berbagi observasi tentang Tiongkok, mencakup aspek budaya yang lebih luas maupun bidang AI itu sendiri.
Jelas, pengetahuan ini akan secara langsung terkait dengan cerita yang sedang berkembang dalam perkembangan terkini AI.
