Editörün Notu: Çinli AI laboratuvarları, küresel büyük model rekabetinde giderek daha fazla dikkat çekmeye başlıyor. Avantajları sadece fazla insan gücü, güçlü mühendislik ve hızlı yineleme ile sınırlı değil; aynı zamanda çok gerçekçi bir organizasyon yaklaşımından geliyor: kavramlardan az, model yapmaya çok; bireysel yıldızlardan az, ekip çalışmasına çok; dış hizmetlere az, kendi temel teknoloji yığınlarını kontrol etmeye çok.
Yazar Nathan Lambert, Çin'in önde gelen AI laboratuvarlarını ziyaret ettikten sonra, Çin'in AI ekosisteminin ABD'ninkinden tamamen farklı olduğunu fark etti. ABD, orijinal paradigmalar, sermaye yatırımı ve önde gelen bilim insanlarının bireysel etkisi üzerinde daha çok odaklanırken, Çin, açık kaynak, mühendislik optimizasyonu ve büyük sayıda genç araştırmacının katkısıyla mevcut yönlerde hızlı bir şekilde geriye kalmayı başarmaktadır ve model yeteneklerini hızla öne taşımaktadır.
En dikkat edilmesi gereken, Çin'in AI'sının ABD'yi aşıp aşmadığı değil, iki farklı gelişim yolu oluşuyor: ABD, sermaye ve ünlü laboratuvarlar tarafından yönlendirilen bir öncül yarışa benziyor, Çin ise mühendislik becerisi, açık kaynak ekosistemi ve teknolojik bağımsızlık bilinciyle birlikte ilerleyen bir endüstri yarışına benziyor.
Bu, gelecekteki AI rekabetinin yalnızca model sıralamaları mücadelesi olmadığını, aynı zamanda organizasyon kapasitesi, geliştirici ekosistemi ve endüstriyel uygulama gücü mücadelesi olacağını anlamına gelir. Çin AI’sındaki gerçek değişim,硅谷’i sadece kopyalamaktan çıkıp, küresel öncü alanlara kendi yöntemleriyle katılmaya başlamasıdır.
Aşağıda orijinal metin yer almaktadır:
Hangzhou'dan Shanghai'ya giden yeni nesil yüksek hızlı trende pencereden dışarı baktım, rüzgâr türbinleriyle süslenmiş belirgin tepeleri, gün batımı ışığında silüet halinde gördüm. Dağlar arka planı oluştururken, önümde geniş tarlalar ve yüksek binaların karışık bir manzarası vardı.
Çin'den büyük bir скромностью döndüm. Bu kadar yabancı bir yerde bu kadar sıcak bir karşılamayla karşılaşmak, çok sıcak ve insani bir deneyimdi. Daha önce sadece uzaktan bildiğim AI ekosistemindeki birçok kişiyle tanışma şansı buldum; onlar beni parlayan gülüşleri ve sıcaklığıyla karşıladı ve çalışmanın ve tüm AI ekosisteminin küresel olduğunu yeniden fark ettim.
Çinli araştırmacıların zihniyeti
Dil modelleri oluşturmakta olan Çinli şirketler, bu teknolojinin «hızlı takipçisi» olmak için çok uygun durumdadır. Bu şirketler, Çin'in uzun süredir sürdürülen eğitim ve çalışma kültürü geleneklerine dayanmaktadır ve aynı zamanda Batı'daki teknoloji şirketlerinin kurulma şekliyle hafifçe farklıdır.
Sadece çıktıya, yani en yeni ve en büyük modellere ve bu modellerin desteklediği ajan tabanlı iş akışlarına bakarsanız; aynı zamanda yetenekli bilim insanları, büyük ölçekli veri ve hızlandırılmış hesaplama kaynakları gibi girdi unsurlarına bakarsanız, Çin laboratuvarları ve ABD laboratuvarları büyük ölçüde benzer görünür. Gerçekten uzun vadeli farklılıklar, bu unsurların nasıl organize edildiğinde ve nasıl şekillendirildiğinde ortaya çıkar.
Çin laboratuvarlarının önde gelen seviyede kalıp yakalamada çok iyi olmasının nedenlerinden birinin, bu görevle kültürel olarak uyumlu olmaları olduğuna daima inandım. Ancak doğrudan insanlarla konuşmadan önce, bu sezgisini önemli bir etkiye bağlamak benim için uygun gelmedi. Çin'in önde gelen laboratuvarlarındaki birçok yetenekli, skönlü ve açık bilim insanıyla konuşmadan sonra düşüncelerim çok daha netleşti.
Günümüzde en iyi büyük dil modelini oluşturmak, verilerden mimari detaylara ve pekiştirmeli öğrenme algoritmalarının uygulanmasına kadar tüm teknik yığın boyunca titiz çalışmayı gerektirir. Modelin her bir bileşeni bazı iyileştirmeler getirebilir; ancak bu iyileştirmeleri bir araya getirmek karmaşık bir süreçtir. Bu süreçte, çoklu hedefli optimizasyonda modelin genel performansını maksimize etmek için bazı çok akıllı bireylerin çalışmaları askıya alınmak zorunda kalabilir.
Amerikalı araştırmacılar ayrıca tek bir bileşen sorununu çözmekte de açıkça yeteneklidir, ancak Amerika'da daha çok "kendi sesinizi duyurmak" kültürü vardır. Bilim insanı olarak, kendi çalışmanız için dikkat çekmeye kendiniz initiative aldığınızda genellikle daha başarılı olursunuz; ve çağdaş kültür, "başlıca AI bilim insanı" olma yoluyla yeni bir ün yolunu teşvik etmektedir. Bu doğrudan çatışmaya yol açar.
Dışarıda yaygın olarak, Llama organizasyonunun bu çıkarlar hiyerarşik yapıya entegre edildikten sonra siyasi baskı nedeniyle çökmesi iddia ediliyor. Aynı zamanda diğer laboratuvarlardan da, bazen öncü bir araştırmacının fikirlerinin nihai modele dahil edilmemesi nedeniyle şikayetlerini durdurmak için “sakinleştirmeye” ihtiyaç duyulabileceğini duydum. Bunun tamamen doğru olup olmadığıne bakılmaksızın, mesaj açık: özbilinç ve kariyer ilerleme arzusu, en iyi modellerin oluşturulmasını engelleyebilir. ABD ve Çin arasında, bu tür kültürel bir küçük yön farkı bile nihai çıktı üzerinde anlamlı bir etki yaratabilir.
Bu farklılıkların bir kısmı, bu modelleri kimlerin inşa ettiğine bağlı. Tüm laboratuvarlarda, temel katkıda bulunanların büyük bir oranı hâlâ okuyan öğrencilerdir. Bu laboratuvarlar oldukça genç; bu da Ai2'deki organizasyon şeklimizi hatırlatıyor: öğrenciler, büyük dil modelleri ekiplerine doğrudan eşit olarak entegre edilir.
Bu, ABD'nin önde gelen laboratuvarlarıyla çok farklı. ABD'de OpenAI, Anthropic, Cursor gibi şirketler tamamen staj imkanı sağlamıyor. Google gibi diğer şirketler, Gemini ile ilgili stajlar sunduğunu söylüyor, ancak birçok kişi, stajının gerçek çekirdek işlerden izole edilip edilmeyeceğinden endişe duyuyor.
Özetle, bu hafif kültürel farklılıklar, model oluşturma yeteneğini şu şekilde artırabilir: Son modeli geliştirmek için insanlar daha az görkemli işleri yapmaya daha istekli olur; AI oluşturmaya ilk kez katılanlar, önceki AI spekülasyon döngülerinden etkilenmeyebilir ve bu nedenle yeni modern teknik yöntemlere daha hızlı uyum sağlayabilirler. Aslında, konuştuğum bir Çinli bilim insanı bu durumu açıkça bir avantaj olarak gördü; daha düşük bir benlik bilinci, organizasyonun ölçeklenebilirliğini kolaylaştırır çünkü insanlar daha az “sistemi oynamaya” çalışır; büyük bir yetenek havuzu, başka yerlerde zaten kanıtlanmış kavramlarla ilgili sorunları çözmek için uygundur vb.
Bu, Çinli araştırmacıların daha az yaratıcı, yeni alanlar açan “0’dan 1’e” akademik çalışmalar ürettiğine dair bilinen bir önyargıyla karşılaştırılıyor.
Bu seyahat sırasında yapılan birkaç akademik odaklı laboratuvar ziyareti sırasında, birçok lider, daha ambisyonlu bir araştırma kültürü geliştirdiklerini belirtti. Aynı zamanda, bazı teknik liderlerle yaptığımız görüşmelerde, bu bilimsel araştırma yaklaşımının yeniden şekillendirilmesinin kısa vadeli olarak mümkün olup olmadığı konusunda şüphe duyuldu; çünkü bu, eğitim ve teşvik sistemlerinin yeniden tasarlanmasını gerektiriyor ve bu değişiklik, mevcut ekonomik denge altında gerçekleşmesi çok zor.
Bu kültür, büyük dil modelleri oluşturma oyununda çok yetenekli öğrenciler ve mühendisler yetiştirmekte gibi görünüyor. Elbette, sayıları da son derece fazla.
Bu öğrenciler, ABD'de olduğu gibi Çin'de de benzer bir beceri kaçışı yaşandığını söyledi: önce akademik kariyer düşünmüş birçok kişi, artık endüstride kalmayı planlıyor. En ilginç ifade, bir zamanlar profesör olmak isteyen bir araştırmacıdan geldi; profesör olmak istediğini, eğitim sistemine yakın olmak için söyledi; ancak ardından eğitim already büyük dil modelleri tarafından çözüldüğünü ekledi: “Öğrenciler benimle neden konuşsun ki!”
Öğrenciler, büyük dil modelleri alanına yeni bir bakış açısıyla giriyor, bu bir avantajdır. Geçtiğimiz yıllarda büyük dil modellerinin temel paradigmalarının sürekli değiştiğini gördük: MoE’yi genişletmekten, pekiştirmeli öğrenmeyi genişletmeye, ardından ajanları desteklemeye kadar. Bu konulardan herhangi birini başarıyla yapmak, hem daha geniş literatür hem de şirket içi teknoloji yığını hakkında çok sayıda arka plan bilgisini son derece hızlı bir şekilde içselleştirmeyi gerektirir.
Öğrenciler, bu tür şeyleri yapmaya alışkındır ve "ne çalışmalı" konusundaki tüm önyargılarını скромlukla bırakmaya isteklidir. Modeli geliştirmek için hayatını tamamen adarlar.
Bu öğrenciler aynı zamanda çok şaşırtıcı bir şekilde doğrudan ve bilim insanlarını meşgul edebilecek felsefi sohbetlerden uzaktır. Modelin ekonomik etkisi veya uzun vadeli sosyal riskleri hakkında nasıl düşündüklerini sorduğumda, karmaşık görüşlere sahip olup bu konularda etki yaratmak isteyen Çinli araştırmacılar açıkça çok daha azdır. Rolleri en iyi modeli oluşturmak olduğuna inanırlar.
Bu fark ince ve kolayca reddedilebilir. Ancak, zarif, zekâlı ve İngilizce ile net bir şekilde ifade edebilen bir araştırmacıyla uzun bir konuşma yaptığınızda en iyi şekilde hissedilir: Yapay Zeka ile ilgili daha felsefi düzeyde bazı sorular sorduğunuzda, bu temel sorular hava asılı kalır ve karşı taraf basit bir kafa karışıklığı gösterir. Onlar için bu, bir kategori hatasıdır.
Bir araştırmacı, Dan Wang'ın ünlü görüşünü aktarıyor: ABD hukukçular tarafından yönetilirken, Çin mühendisler tarafından yönetiliyor. Bu sorunları tartışırken, bu benzetmeyi Çin'de inşa etme isteklerini vurgulamak için kullanıyor. Çin'de, Dwarkesh veya Lex gibi süper popüler podcast'lerin Amerikalı bilim insanlarını yıldızlaştırabileceği gibi, Çinli bilim insanlarının yıldızlaşmasını sağlayacak sistematik bir yol yok.
Çinli bilim insanlarını, yapay zekânın yarattığı geleceğin ekonomik belirsizlikleri, basit AGI yeteneklerinin ötesindeki sorunlar veya modellerin nasıl davranması gerektiğiyle ilgili ahlaki tartışmalar hakkında yorum yapmaya çalıştım; bu sorunlar nihayetinde bu bilim insanlarının büyüme ve eğitim arka planlarını ortaya koydu (düzenlendi). Çalışmalarına son derece odaklanmışlardır, ancak toplumun nasıl organize edilmesi ve nasıl değiştirilmesi gerektiği konusunda tartışmaya ve ifadeye teşvik edilmeyen bir sistemde büyümüşlerdir.
Daha geniş bir bakış açısıyla, özellikle Pekin’i görünce, bana Körfez Bölgesi’ne çok benziyor: Bir rekabetçi laboratuvar, belki de yaya ya da taksiyle birkaç dakika uzaklıkta. Uçaktan iner inmez, otelime gitmeden önce Alibaba Pekin kampüsünü ziyaret ettim. Sonraki 36 saat içinde, Zhipu AI, Moonshot AI, Tsinghua Üniversitesi, Meituan, Xiaomi ve 01.ai’yi ziyaret ettik.
Çin'de DiDi ile seyahat etmek çok kolaydır. XL araba türünü seçerseniz, genellikle masaj koltuklu elektrikli küçük bir minibus tahsis edilir. Yetenek rekabeti konusunda araştırmacılarla konuştuk ve bunun Amerika'da yaşadıklarımızla çok benzer olduğunu söylediler. Araştırmacıların iş değiştirmesi normaldir ve insanlar nereye gideceklerini büyük ölçüde şu anda nerede ortamın en iyi olduğu üzerine karar verir.
Çin'de büyük dil modelleri topluluğu, birbirleriyle savaşan kabileler yerine bir ekosistem gibi hissediliyor. Birçok gizli görüşmede, karşıdaki kişilerle ilgili neredeyse tamamen saygı ifadeleri duyuyorum. Tüm Çin laboratuvarları, Çin'in tek önde gelen kapalı kaynak laboratuvarı olması nedeniyle ByteDance ve popüler DouBao modelinden korkuyor. Aynı zamanda, tüm laboratuvarlar DeepSeek'i, uygulama düzeyinde en fazla araştırma zevkine sahip laboratuvar olarak büyük saygıyla karşılıyor. ABD'de, bir laboratuvar üyesiyle gizli bir konuşma yaptığınızda, ateşler genellikle hemen kıvılcımlar halinde saçılıyor.
Çinli araştırmacıların skrupülözlüğü arasında, beni en çok etkileyen nokta, ticari düzeyde de omuz silkmeleri ve bunun onların sorunu olmadığını söylemeleridir. ABD’de ise görünüşe göre herkes, veri satıcılarından hesaplama gücüne, finansmana kadar çeşitli ekosistem düzeyindeki endüstri trendlerine takılmış gibi görünüyor.
Çin'in AI endüstrisi ile Batı laboratuvarları arasındaki farklılıklar ve benzerlikler
Bir AI modeli oluşturmanın bugün bu kadar ilginç olmasının nedeni, sadece bir dizi yetenekli araştırmacının aynı binada bir araya gelip bir mühendislik mucizesi yaratması değil. Geçmişte gerçekten böyleydi, ancak AI işini sürdürebilmek için büyük dil modelleri artık bir karışım haline geliyor: inşa etmek, dağıtmak, finanse etmek ve bu yaratığın benimsenmesini sağlamak içindir.
Önde gelen AI şirketleri karmaşık bir ekosistem içinde yer alır. Bu ekosistemler, öncü gelişmeleri sürekli olarak ilerletmek için finansman, hesaplama gücü, veri ve daha fazla kaynak sağlar.
Batı ekosisteminde, büyük dil modellerini oluşturmak ve sürdürmek için gerekli olan çeşitli girdi unsurlarının entegrasyonu nispeten tamamen kavramsallaştırılmış ve haritalanmıştır. Anthropic ve OpenAI bunun tipik örnekleridir. Bu nedenle, Çin laboratuvarlarının bu sorunlarla ilgili düşüncelerinde belirgin farklılıklar tespit edebilirsek, farklı şirketlerin gelecekte hangi anlamlı farklılıklara odaklanabileceğini görebiliriz. Elbette, bu gelecekler finansman ve/veya hesaplama gücü kısıtlamaları tarafından güçlü bir şekilde etkilenecektir.
Bu laboratuvarlarla yapılan görüşmelerden elde edilen en büyük 「AI endüstri düzeyi」 kazanımlarını aşağıdaki gibi özetliyorum:
Birinci olarak, yerel AI talebinde erken işaretler ortaya çıkmıştır.
Çin AI pazarının daha küçük olacağını öne süren yaygın bir varsayım, Çin şirketlerinin genellikle yazılım için ödeme yapmayı istememesi nedeniyle, laboratuvarları destekleyecek kadar büyük bir çıkarım pazarını hiçbir zaman serbest bırakamayacağını iddia eder.
Ancak bu değerlendirme yalnızca SaaS ekosistemine karşılık gelen yazılım harcamaları için geçerlidir. SaaS ekosistemi, Çin tarihi boyunca her zaman küçüktü. Öte yandan Çin, açıkça halen büyük bir bulut pazarına sahiptir.
Önemli ve henüz cevaplanmamış bir soru şudur: Çinli şirketlerin AI üzerine yaptığı harcamalar, daha küçük ölçekli bir SaaS pazarına mı benzecek, yoksa temel harcamalara dayalı bir bulut pazarına mı? Bu soru Çin laboratuvarları içinde bile tartışılıyor. Genel olarak, AI'nın bulut pazarına daha çok yaklaştığını hissediyorum ve yeni araçlar etrafında oluşan bir pazarın büyüyemeyeceği konusunda kimse gerçekten endişeli değil.
İkinci olarak, çoğu geliştirici Claude'den büyük etki görmüştür.
Claude resmi olarak Çin'de yasak olsa da, Çin'in çoğu AI geliştiricisi Claude'ye ve yazılım oluşturma yöntemlerini nasıl değiştirdiğine büyük ilgi gösteriyor. Çin'in geçmişte yazılım satın alma konusunda az ilgili olmasının, Çin'de büyük bir çıkarım talebi artışı yaşanmayacağını anlamına gelmediği gibi.
Çinli teknik ekipler çok pratik, скром ve motive. Bu durum, hiçbir "yazılım almadan tasarruf etme" tarihsel alışkanlığından daha güçlü bir izlenim bıraktı.
Bazı Çinli araştırmacılar, kendi araçlarını kullanarak inşa ettiklerini, örneğin Kimi veya GLM'in komut satırı araçlarını belirtir, ancak herkes Claude'i kullandığını söyler. İlginç bir şekilde, Codex'e nadiren atıfta bulunulur, oysa Codex Körfez Bölgesi'nde açıkça hızla popülerleşmektedir.
Üçüncü olarak, Çinli şirketlerin bir teknoloji mülkiyeti anlayışı vardır.
Çin kültürü, gürültülü bir ekonomik motorla birleşerek öngörülemeyen sonuçlar üretiyor. Burada bıraktığım derin izlenimlerden biri, sayıca çok sayıda AI modelinin, buradaki birçok teknoloji şirketinin gerçeklikteki pratik dengesini yansıttığıdır. Toplu bir planlama yoktur.
Bu endüstri, Bytedance ve Alibaba'ya olan saygı ile tanımlanır. Bunlar, güçlü kaynaklarla birçok pazarı kazanacak büyük mevcut oyuncular olarak kabul edilir. DeepSeek, saygı gören bir teknoloji lideridir, ancak uzakta bir pazar lideri değildir. Yön belirlerler, ancak pazarı ekonomik olarak kazanmak için yapısal bir güce sahip değillerdir.
Bu, Meituan veya Ant Group gibi şirketleri bırakır. Batılılar, bunların neden bu modelleri geliştirdiğini şaşıracaktır. Ancak aslında, büyük dil modellerini geleceğin teknoloji ürünlerinin çekirdeği olarak görüyorlar ve güçlü bir temele ihtiyaçları var.
Güçlü bir genel modeli ince ayarladıklarında, açık kaynak topluluğunun modele verdiği geri bildirimler, teknoloji yığınlarını daha sağlam hale getirirken, aynı zamanda kendi ürünlerleri için dahili ince ayar sürümlerini de koruyabilirler. Bu endüstrideki “açık öncelikli” zihniyet, büyük ölçüde pratikçilikle tanımlanır: bu yaklaşım, modele güçlü geri bildirim sağlamayı, açık kaynak topluluğuna katkıda bulunmayı ve kendi misyonlarını güçlendirmeyi sağlar.
Dördüncü, hükümet desteği gerçek, ancak ölçeği belirsiz.
İnsanlar genellikle Çin Hükümeti'nin büyük dil modelleri yarışmasını açıkça desteklediğini iddia eder, ancak bu, her bir katmanın kendi ne yapması gerektiği konusunda net bir işlem kılavuzuna sahip olmadığı, çok katmanlı ve nispeten merkeziyetsiz bir hükümet yapısıdır.
Pekin'in farklı semtleri arasında, teknoloji şirketlerinin ofislerini kendi bölgelerine kurmaları için rekabet vardır. Bu şirketlere sağlanan “yardımlar”, neredeyse kesinlikle lisans gibi bürokratik süreçlerdeki gereksiz işlemlerin kaldırılmasını içerir. Ancak bu yardımlar ne kadar ileri gidebilir? Hükümetin farklı seviyeleri, yetenekli insanları çekmeye yardımcı olabilir mi? Çip kaçakçılığına yardımcı olabilir mi?
Gezinti boyunca hükümetin ilgisi veya desteğiyle ilgili birçok atıf bulundu, ancak bu bilgiler, detayları iddia ederek raporlamak için yeterli değil ve hükümetin Çin'in AI gelişim yolunu nasıl değiştirebileceği konusunda güvenli bir dünya görüşü oluşturmamı sağlayamadı.
Elbette, Çin Hükümeti'nin en üst düzeyinin modelin herhangi bir teknik kararını etkilemeye yönelik hiçbir işaret yoktur.
Beşinci olarak, veri endüstrisi Batı'nın gerisinde kalıyor.
Daha önce, Anthropic veya OpenAI'nin tek bir ortam için 10 milyon doların üzerinde harcama yaptığını, her yıl pekiştirmeli öğrenimin öncü alanını ilerletmek için milyarlarca dolarlık toplam harcamalar yaptığını duymuştuk. Bu nedenle, Çin laboratuvarlarının da ABD şirketlerinden aynı ortamları satın alıp almadığını ya da onları destekleyen bir yansıma şeklinde yerel bir ekosistemin olup olmadığını merak ediyoruz.
Cevap, tam anlamıyla «veri endüstrisi yoktur» demek değil, aksine deneyimlerine göre veri endüstrisinin kalitesi nispeten düşüktür; bu nedenle çoğu zaman daha iyi çözüm, iç ortam veya verileri kendi kendine kurmaktır. Araştırmacılar, kendi kendilerine pek çok zamanı reinforcement learning eğitim ortamları oluşturmak için harcarlar; ancak ByteDance, Alibaba gibi daha büyük şirketler ise bunu desteklemek için iç veri etiketleme ekiplerine sahiptir. Bunların hepsi önceki bahsedilen «satın almak yerine kendi kendine kur» tutumunu yansıtır.
Altıncı olarak, daha fazla NVIDIA çipine olan talep çok güçlü.
NVIDIA'nın hesaplama gücü eğitim için altın standarttır ve herkesin ilerlemesi daha fazla hesaplama gücü olmaması nedeniyle sınırlıdır. Tedarik yeterli olsaydı, açıkçası bunları satın alırlardı. Huawei dahil olmak üzere diğer hızlandırıcılar, çıkarım açısından olumlu geri bildirimler almıştır. Sayısız laboratuvar Huawei çiplerine erişebilmektedir.
Bu noktalar, çok farklı bir yapay zeka ekosistemi çiziyor. Batı laboratuvarlarının çalışma biçimini Çinli meslektaşlarına hızlıca uygulamak, sıklıkla kategorik hatalara yol açar. Ana soru, bu farklı ekosistemlerin özünde farklı model türleri mi üretir; yoksa Çin modellerinin her zaman 3 ila 9 ay önceki ABD öncü modellerine benzer şekilde mi yorumlanacağıdır.
Sonuç: Küresel denge
Bu seyahetten önce Çin hakkında çok az şey biliyordum; ayrılırken ise sadece öğrenmeye başladığımı hissettim. Çin, kurallarla veya tariflerle ifade edilebilecek bir yer değil, çok farklı dinamiklere ve kimyasal tepkimelere sahip bir yer. Kültürü o kadar eski ve derin ki, hâlâ ülkenin teknolojik altyapısının oluşturulma şekliyle tamamen iç içe geçmiş durumda. Öğrenmem gereken çok şey var.
ABD'nin mevcut güç yapısının birçok bölümü, Çin hakkındaki mevcut görüşlerini karar alma sürecinde kritik bir zihinsel araç olarak kullanmaktadır. Çin'deki neredeyse tüm önde gelen AI laboratuvarlarıyla resmi veya resmi olmayan yüz yüze görüşmelerimden sonra, Çin'in batı karar alma yöntemlerinin modellemesinin zor olduğu birçok kalite ve içgüdüye sahip olduğunu fark ettim.
En güçlü modellerini neden açıkça yayınladıklarını doğrudan sorsam bile, "sahiplik zihniyeti" ile "ekosisteme samimi destek" arasındaki kesişimi tamamen birleştirmek hâlâ zor.
Buradaki laboratuvar çok pratiktir ve açık kaynak konusunda mutlakçı değildir; her oluşturdukları modeli açıkça yayınlamazlar. Ancak geliştiricileri desteklemekte, ekosistemi desteklemekte ve açıklığı kendi modellerini daha iyi anlamak için bir araç olarak kullanmada derin niyetlere sahiptirler.
Çin'in neredeyse tüm büyük teknoloji şirketleri kendi genel büyük dil modellerini geliştiriyor. Meituan gibi platform tabanlı hizmet şirketlerinin ve Xiaomi gibi büyük tüketim teknoloji şirketlerinin açık ağırlıklı modelleri yayınladığını gördük. Amerika'daki benzer şirketler genellikle sadece hizmet satın alır.
Bu şirketler, popüler yeni şeylere dikkat çekmek için büyük dil modelleri oluşturmadı, aksine daha derin ve temel bir istekten kaynaklanarak: kendi teknoloji yığınlarını kontrol altına almak ve günümüzün en önemli teknolojisi olan bu alanı geliştirmek. Bilgisayarımın ekranından başımı kaldırırsam, ufukta sürekli vinçlerin topluluklarını görürüm; bu da Çin'in daha geniş inşaat kültürü ve inşaat enerjisiyle tamamen uyumludur.
Çinli araştırmacıların insani yanları, çekicilikleri ve samimi sıcaklıkları çok yakındır. Kişisel düzeyde, Amerika'da alışkın olduğumuz o sert coğrafi politika tartışmaları onlara hiç nüfuz etmemiştir. Bu dünyada bu kadar basit olumlu bir şey daha fazla olabilir. AI topluluğunun bir üyesi olarak, şu anda en çok endişelendiğim şey, ulusal etiketler etrafında üyeler ve gruplar arasında ortaya çıkan çatlaklardır.
AI teknoloji yığınındaki her bir bölümden ABD laboratuvarlarının açıkça lider olmasını istemediğimi söyleyorsam, bu bir yalan olurdu. Özellikle çok zaman harcadığım açık modeller alanında, ben bir Amerikalıyım ve bu bir dürüst tercihtir.
Aynı zamanda, açık ekosistemin kendisinin küresel olarak çoğalmasını diliyorum, çünkü bu, dünyaya daha güvenli, erişilebilir ve daha kullanışlı bir AI yaratacaktır. Ancak şu anda soru, Amerikan laboratuvarlarının bu liderlik pozisyonunu ele alıp almayacaklarıdır.
Bu makaleyi yazarken, idari emirlerin açık modellere etkisiyle ilgili daha fazla söylenti yayılıyor. Bu, ABD liderliği ile küresel ekosistem arasındaki iş birliğini daha da karmaşık hale getirebilir — bu da beni daha fazla güvenli hissettirmiyor.
Yıldızın Karanlık Yüzü, ZhiPu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai ve diğer kurumlarla yaptığım görüşmelerde yer alan tüm harika insanlar için teşekkür ederim. Herkes çok sıcak ve zamanlarını çok cömertçe ayırdı. Fikirlerim şekillendikçe, Çin hakkında daha geniş kültürel boyutları da içerecek şekilde, aynı zamanda AI alanını da kapsayacak şekilde gözlemlerimi paylaşmaya devam edeceğim.
Bu bilgiler, AI'nın öncü gelişmeleriyle ilgili hikâyeye doğrudan bağlanmaktadır.
