Yazar: Chen Junda
Zhixidong, 27 Mart'ta, Çin Zhongguancun Forumu'nda, Zhipu'nun CEO'su Zhang Peng, Moonshot'in CEO'su Yang Zhilin (sunucu olarak), Xiaomi MiMo büyük model sorumlusu Luo Fuli, Wuwen Xinqiong CEO'su Xia Lixue ve Hong Kong Üniversitesi yardımcı doçenti Huang Chao, açık kaynaklı büyük modeller ve akıllı ajanların geleceğine dair nadir bir panelde bir araya geldi.
Bu konuşma, şu anda en popüler olan OpenClaw ile başlıyor ve konuklar, agentlerin büyük modellerin gerçekten "çalışmaya" başladığını kabul ediyor. OpenClaw, büyük modellerin kapasite sınırlarını genişletiyor ancak modellere daha yüksek talepler getiriyor; Zhipu, uzun vadeli planlama ve kendi kendini ayarlama gibi yetenekler üzerinde çalışıyor, Ro Fuli ekibi ise maliyeti düşürmek, hızı artırmak ve hatta modelin kendi kendine evrimleşmesini sağlamak için mimari yeniliklere odaklanıyor.
Altyapı da agente tempo ile uyumlu hale getirilmelidir. Xia Lixue, mevcut hesaplama kapasitesi sistemlerinin ve yazılım mimarilerinin hâlâ insanlar için tasarlandığını, agente için değil olduğunu ve aslında insan operasyon kapasitesinin Agent'in potansiyelini sınırladığını düşünmektedir. Bu nedenle, Agentic Infra'yı oluşturmalıyız.
Çok sayıda konuk görüşüne göre, açık kaynak, büyük modeller ve ajanların gelişimindeki temel güçlerden biridir. Hong Kong Üniversitesi Yardımcı Profesörü Huang Chao, açık kaynak ekosisteminin gelişiminin, ajantların “oyuncağı”ndan gerçek bir “çalışan” haline gelmesinin anahtarı olduğunu düşünüyor. Sadece topluluk tarafından ortaklaşa geliştirilerek, yazılım, veri ve teknolojinin tamamı ajantlara özgün bir forma dönüşebilir ve nihayetinde sürdürülebilir bir küresel AI ekosistemi oluşturulabilir.
Ayrıca, birkaç konuk, büyük modellerdeki fiyat artışları, token kullanımındaki patlama ve AI'nın önümüzdeki 12 ayın anahtar kelimeleri gibi konular üzerinde tartıştı. İşte bu masa turunun temel görüşleri:
1. Zhang Peng: Model büyüdükçe çıkarım maliyetleri de bununla orantılı olarak artar; yakın zamanda Zhipu'nun fiyat artırma stratejisi, normal ticari değere dönüşümdür. Uzun vadeli düşük fiyat rekabeti sektörün gelişimi için uygun değildir.
2. Zhang Peng: Akıllı ajanlar gibi yeni teknolojilerin patlaması, token kullanımını 10 kat artırdı, ancak gerçek talep 100 kat artmış olabilir ve hâlâ karşılanmamış büyük bir talep var; bu nedenle hesaplama gücü, önümüzdeki 12 ay içinde hâlâ kritik bir sorun olmaya devam edecektir.
3. Luo Fuli: Temel büyük model üreticilerinin bakış açısından, OpenClaw temel büyük modellerin alt sınırını garanti ederken üst sınırını yükseltiyor. Yerli açık kaynak modeller + OpenClaw görev tamamlama oranları Claude'ye çok yakın düzeyde.
4. Luo Fuli: DeepSeek, yerli büyük model üreticilerine cesaret ve güven verdi. Görünüşte "verimlilik için uzlaşmak" gibi görünen model yapı yenilikleri, gerçek bir değişime yol açtı ve sektörün hesaplama gücü sınırlı olmasına rağmen en yüksek zeka seviyesini ortaya çıkarmasını sağladı.
5. Luo Fuli: Sonraki yılın AGI yolculuğunda en önemli olay "kendi kendini geliştirmek" olacaktır. Kendi kendini geliştirme, büyük modellerin en iyi bilim insanları gibi keşif yapmasını sağlar ve "yeni bir şey yaratmanın" tek yoludur. Xiaomi, Claude Code+ en iyi modelleri kullanarak araştırmaların verimliliğini 10 kat artırmıştır.
6. Xia Lixue: AGI çağı geldiğinde, altyapı kendisi bile bir varlık olmalı, tüm altyapıyı kendi kendine yönetmeli ve AI müşterilerinin ihtiyaçlarına göre altyapıyı geliştirmeli, kendi kendini evriltmeli ve kendi kendini yenilemelidir.
7. Xia Lixue: OpenClaw, token kullanımını patlattı. Şu anki token tüketim hızı, 3G dönemine yeni başlandığında her ay sadece 100 MB veri limiti olan hissiyle aynı.
8. Huang Chao: Gelecekte birçok yazılım, insanlara yönelik olmayacaktır; yazılım, veri ve teknoloji, Agent-Native bir biçimde programlanacaktır. İnsanlar gelecekte sadece “kendilerini mutlu eden GUI’leri” kullanacaktır.
Bu masal turu tartışmanın tam metni şudur:
01. OpenClaw, "iskele" anlamına gelir ve büyük model token tüketimi hâlâ 3G dönemindedir
Yang Zhilin: Bugün önemli konuklarımızı davet etmekten büyük onur duyarım; konuklarımız model katmanından, hesaplama katmanına ve agent katmanına kadar geniş bir yelpazeyi kapsıyor. Bugün anahtar kelimelerimiz açık kaynak ve agent.
İlk soru şu anda en popüler OpenClaw hakkında. Günlük yaşamda OpenClaw veya benzer ürünler kullanırken en yaratıcı veya izlenim bırakan noktalar neler? Teknik açıdan bugün OpenClaw ve ilgili Agent'ların gelişimini nasıl değerlendiriyorsunuz?

Zhang Peng: Çok önce OpenClaw'u kendim oynamaya başlamıştım, o zamanlar Clawbot adını taşıyordu. Kendim denemeler yaptım, çünkü programcı olarak bu tür şeylere dair kendi deneyimlerime sahibim.
OpenClaw'ın herkese sunduğu en büyük yenilik, programcıların veya teknoloji tutkunlarının özel hakkı olmaktan çıkıp, sıradan kullanıcıların özellikle programlama ve ajanlar konularında öncü modellerin yeteneklerini kolayca kullanabilmesidir.
Bu nedenle, şimdiye kadar sizlerle olan iletişimim sırasında, OpenClaw'u daha çok “iskele” olarak adlandırmayı tercih ediyorum. Bu, temel modellerin üzerine sağlam, pratik ancak esnek bir iskele kurar. Sizler, temel modellerin sunduğu yenilikçi özelliklerden kendi isteğinize göre yararlanabilirsiniz.
Kendi fikirlerimin kod yazamama veya diğer ilgili becerileri öğrenmemekten dolayı sınırlı kalacağını düşünüyordum, ama bugün OpenClaw ile sadece basit bir iletişim kurarak bunu tamamlayabiliyorum.
OpenClaw, bana çok büyük bir etki yaptı ya da bu konuyu yeniden tanıtmamı sağladı.

Xia Lixue: Aslında OpenClaw'u ilk kullandığımda alışamadım, çünkü büyük modellerle konuşmak alışkanlığım vardı; kullanımdan sonra OpenClaw'un çok yavaş tepki verdiğini hissettim.
Ama daha sonra bunun önceki sohbet robotlarından büyük bir farkı olduğunu, yani büyük görevlerimi tamamlayabilecek bir “kişi” olduğunu fark ettim. Daha karmaşık görevler vermeye başladım ve aslında bunun çok iyi yapabildiğini gördüm.
Bu olay bana büyük bir etki bıraktı. Model, başlangıçta tokenlere dayalı sohbet yapmaktan, şimdi bir ajanta, bir karides haline gelerek görevlerinizi tamamlamaya yardımcı olabiliyor. Bu, AI'nın genel hayal gücü alanını büyük ölçüde genişletiyor.
Aynı zamanda, tüm sistemin kapasitesi için de talepler arttı. Bu, OpenClaw'u ilk başta kullandığımda biraz yavaş hissetmemin nedeni. Altyapı katmanı sağlayıcısı olarak, OpenClaw'un AI'nın arkasındaki büyük sistem ve ekosisteme daha fazla fırsat ve zorluk getirdiğini görüyorum.
Şu anda sahip olduğumuz tüm kaynaklar, bu kadar hızlı büyüyen bir dönemi desteklemek için yetersiz. Örneğin, şirketimiz açısından bakarsak, ocak ayının sonundan beri yaklaşık her iki haftada bir token tüketimimiz iki katına çıkıyor ve şu anda yaklaşık 10 kat arttı.
Bu hızı son kez 3G telefonla veri tüketirken görmüştüm. Şu anki token tüketiminin, eski zamanlarda ayda sadece 100 MB telefon verisi olan döneme benzediğini hissediyorum.
Bu durumda, tüm kaynaklarımızı daha iyi optimize etmek ve entegre etmek gerekiyor. Herkesin, sadece AI alanında değil, toplumun her kesimindeki her bireyin OpenClaw'un AI yeteneklerini kullanabilmesini sağlamak.
Altyapı oyuncusu olarak, bu döneme büyük bir heyecanla ve derin bir şekilde bağlıyım. Ayrıca, hala keşfetmeli ve denemeli olduğumuz birçok iyileştirme alanı olduğunu düşünüyorum.
02. OpenClaw, yerel modellerin üst sınırını artırıyor, etkileşim modu önemli bir atılım sağlıyor
Ro Fuli: Ben OpenClaw'u, bir agent çerçevesinin gelişim sürecindeki son derece devrimci ve yıkıcı bir olay olarak görüyorum.
Gerçekten de derin düzeyde kodlama yapan tüm çevremdeki kişilerin ilk tercihi hâlâ Claude Code. Ancak OpenClaw kullananların, Agent çerçevesindeki birçok tasarımın Claude Code'dan daha ileri olduğunu fark edeceğini düşünüyorum. Son zamanlarda Claude Code'un yaptığı birçok güncelleme aslında OpenClaw'a doğru ilerliyor.
OpenClaw'u kendim kullandığım zaman, bu çerçevenin bana her yerde ve her zaman yaratıcılığımı genişletme imkanı sunduğunu hissettim. Claude Code başlangıçta yalnızca masaüstümden yaratıcılığımı genişletebiliyordu, ancak OpenClaw yaratıcılığımı her yerde ve her zaman genişletebilir.
OpenClaw, temel olarak iki ana değeri sunar. İlk olarak, açık kaynaklıdır. Açık kaynaklı olmak, tüm topluluğun derinlemesine katılımını, bu çerçevenin gelişimini önemsemesini ve ilerletmesini çok büyük ölçüde kolaylaştırır; bu, çok önemli bir ön koşuldur.
OpenClaw gibi bir AI çerçevesinin büyük bir değeri, ülke içinde kapalı kaynak modellerine yakın olsa da tam olarak yetişememiş modellerin üst sınırını çok yüksek seviyelere çıkarmasıdır.
Çoğu senaryoda, bunun (yerel açık kaynak model + OpenClaw) Claude'nin en yeni modeliyle neredeyse aynı düzeyde görev tamamlama başarısı sağladığını göreceksiniz. Aynı zamanda, bir Harness sistemi veya beceriler sistemi gibi çok yönlü tasarımlar aracılığıyla görevlerin bütünlüğünü ve doğruluk oranını garanti altına alır.
Temel büyük model sağlayıcılarının geliştirici bakış açısından, OpenClaw temel büyük modelin alt sınırını garanti altına alır ve üst sınırını yükseltir.

Ayrıca, bunun topluluk genelinde yarattığı diğer bir değer, büyük modellerin dışında Agent katmanının gerçekten büyük bir hayal gücüne sahip olduğunu insanların fark etmesini sağlamasıdır.
Son zamanlarda, araştırmacılar dışında toplulukta giderek daha fazla kişinin AGI'nin dönüşümüne dahil olduğunu, Harness, Scaffold gibi daha güçlü Agent çerçevelerine daha fazla kişinin ulaşmaya başladığını gözlemledim. Bu kişiler, bu araçları kullanarak işlerinin bir kısmını yerine getiriyor ve daha yaratıcı şeylere odaklanmak için kendi zamanlarını serbest bırakıyorlar.
Huang Chao: Benim düşünceme göre, OpenClaw'ın bu kez popüler olmasının ilk nedeni, daha "insansı" bir etkileşim deneyimi sunması. Aslında bir iki yıldır Agent üzerinde çalışıyoruz, ancak önceki Cursor, Claude Code gibi Agent'lar daha çok bir "araç" hissi veriyordu. OpenClaw ise ilk kez "anlık mesajlaşma uygulamasına entegre" bir şekilde, insanların "kişisel JARVIS" olarak düşündükleri şeye daha yakın bir deneyim sunuyor. Bence bu, etkileşim modelinde bir kırılma noktası olabilir.
Ayrıca, topluluğa verdiği ders şudur: Agent Loop gibi basit ancak verimli bir çerçeve yeniden mümkün olduğu kanıtlanmıştır. Aynı zamanda, tüm işleri yapabilecek bir süper agente mi ihtiyacımız var, yoksa hafif bir işletim sistemi veya iskele gibi daha iyi bir “küçük yönetici” mi? sorusunu yeniden düşünmeye zorlamaktadır.
OpenClaw, bu "küçük sistem" veya "yengeç işletim sistemi" ve ekosistemi aracılığıyla, kullanıcıların gerçekten "oynamak" hissiyatına sahip olmalarını sağlayarak ekosistemin tüm araçlarını harekete geçirmeyi amaçlar.
Yeteneklerin, Harness gibi yeteneklerin ortaya çıkmasıyla, OpenClaw gibi sistemlere yönelik uygulamalar tasarlamak ve çeşitli sektörleri güçlendirmek için daha fazla kişiye olanak sağlanmaktadır. Bence bu nokta, açık kaynak ekosistemiyle doğal olarak çok sıkı bir şekilde bağlantılıdır. Benim görüşüme göre, bu iki nokta bize en büyük ilhamı veren unsurlardır.
03.GLM, "çalışmak" için özel olarak geliştirilen yeni model; fiyat artışı, normal ticari değere dönüşümdür.
Yang ZhiLin: Zhang Peng'den bir şey sormak istiyorum. Son zamanlarda Zhipu'nun yeni GLM-5 Turbo modelini yayınladığını gördüm ve Agent yeteneklerinde büyük bir güçlenme olduğunu anlıyorum. Bu yeni modelin diğer modellerden farklarını herkese açıklayabilir misiniz? Ayrıca fiyat artış stratejisi gözlemlediğimizi de görüyoruz; bu hangi piyasa sinyallerini yansıtmaktadır?
Zhang Peng: Bu çok iyi bir soru. İki gün önce gerçekten acil bir güncelleme gerçekleştirdik; bu aslında tüm gelişim rota planımızın bir aşamasıydı, ancak onu erken yayınladık.
Ana amaç, eski “basit diyalog”tan “gerçek iş yapma”ya geçiş yapmaktır—bu da son zamanlarda herkesin yaşadığı şeydir: büyük modeller artık sadece konuşabilmekle kalmıyor, aynı zamanda insanlara gerçek işlerde yardımcı olabiliyor.
Ancak “çalışmak” arkasında çok yüksek bir yetenek gereklidir. Model, uzun vadeli görev planlaması yapmalı, sürekli deneme-yanılma yapmalı, bağlamı sıkıştırmalı, hata ayıklamalı ve multimodal verilerle de ilgilenmelidir. Bu nedenle, geleneksel diyalog odaklı genel modellere kıyasla model üzerindeki gereksinimler oldukça farklıdır. GLM-5 Turbo, özellikle bahsettiğiniz gibi — modelin çalışmasını sağlamak ve 72 saat boyunca sürekli döngüde kalmasını sağlamak — konularında özel olarak güçlendirilmiştir ve bunun için birçok çalışma yapılmıştır.
Ayrıca kullanıcılar token tüketimi konusunda da büyük ilgi gösteriyor. Karmaşık görevler için akıllı bir model kullanmak, token tüketimini büyük ölçüde artırır. Ortalama bir kullanıcı bu durumu fark etmeyebilir, ancak fatura geldiğinde paranın çok hızlı azaldığını görür. Bu nedenle bu alanda da iyileştirmeler yaptık; karmaşık görevlerde model, daha verimli bir token verimliliğiyle görevleri tamamlayabiliyor. Genel olarak modelin yapısı hâlâ çoklu görevli ortak bir yapıdır, ancak yeteneklerinde öncelikli güçlendirmeler yapılmıştır.
Fiyat artışını aslında çok iyi açıklayabiliriz. Daha önce bahsedildiği gibi, artık sadece bir soru sorup bir cevap almak değil, arka planda çok uzun bir mantık zinciri var. Birçok görev, kod yazarak ve alt yapıyla etkileşim kurarak gerçekleştirilir ve sürekli hata ayıklama ve düzeltme yapılır; bu da çok büyük bir tüketim gerektirir. Bir karmaşık görevi tamamlamak için gereken token miktarı, eski basit bir soruya cevap vermek için gerekenin on katı hatta yüz katı olabilir.
Bu nedenle fiyatlar bir miktar artırıldı, model de büyütüldü ve çıkarım maliyetleri buna göre yükseldi. Uzun vadeli düşük fiyat rekabetinin tüm sektörün gelişimi için uygun olmadığını düşünüyoruz ve bu nedenle ticari değeri normal seviyeye getirdik. Bu, ticari modelin döngüsünü oluşturarak, model yeteneklerini sürekli olarak iyileştirip daha iyi hizmetler sunmamızı sağlıyor.
04. Daha verimli bir token fabrikası oluşturmak için altyapı kendisi de bir Agent olmalıdır.
Yang Zhilin: Şu anda açık kaynak modelleri giderek artıyor ve bir ekosistem oluşturuyor; çeşitli modeller farklı hesaplama platformlarında kullanıcılara daha fazla değer sunuyor. Token kullanımının patlamasıyla büyük modeller, eğitim döneminden çıkarım dönemine geçiyor. Lütfen Li Xue’den, altyapı düzeyinde çıkarım dönemi, Wuwen için ne anlama geliyor?
Xia Lixue: Biz, AI çağında doğan bir altyapı firmasıyız ve şu anda Zhipu, Kimi, Mimo gibi şirketlere de destek vererek, token fabrikalarını daha verimli kullanmalarını sağlıyoruz. Aynı zamanda birçok üniversite ve araştırma kurumuyla iş birliği yapıyoruz.
Bu yüzden sürekli bir şey üzerinde düşündük: AGI çağında hangi altyapı gereklidir? Ve bunu nasıl adım adım gerçekleştirebilir ve öngörebiliriz? Kısa, orta ve uzun vadeli farklı aşamalarda çözülmesi gereken sorunlar için tamamen hazırız.
Şu anda en doğrudan sorun, daha önce konuşulan tüm Open'un getirdiği token miktarındaki patlamadır ve bu, sistem verimliliği için daha yüksek iyileştirme ihtiyaçları yaratır. Fiyat ayarlamaları da bu ihtiyaç altında bir yanıt şeklidir.
Biz, yazılım ve donanımın entegrasyonu yoluyla her zaman planlama ve çözüm üretmeye devam ettik. Örneğin, neredeyse tüm türde hesaplama çiplerine entegrasyon sağladık ve ülkenin onlarca farklı çipini ve onlarca farklı hesaplama kümesini tek bir sistemde birleştirdik. Bu, AI sistemlerindeki hesaplama kaynakları kıtlığını çözecektir; kaynak yetersiz olduğunda en iyi çözüm, kullanılabilir tüm kaynakları kullanmak ve her hesaplama gücünün en verimli şekilde kullanılmasını sağlamaktır.
Bu aşamada çözmeye çalıştığımız soru, daha verimli bir token fabrikası nasıl oluşturulur. Burada model ve donanım üzerindeki video belleği gibi çeşitli kaynakların en iyi uyumunu sağlamak için birçok optimizasyon yaptık ve en yeni model yapıları ile donanım yapıları arasında daha derin bir kimyasal tepkime oluşup oluşmayacağını inceledik. Ancak mevcut verimlilik sorununu çözmek, sadece standartlaştırılmış bir token fabrikası inşa etmekti.

Agent eraına doğru ilerlerken, bunun yeterli olmadığını düşünüyoruz. Çünkü Agent, bir insana daha çok benzer ve ona bir görev verebilirsiniz. Şimdiki bulut hesaplama çağı altyapısının, bir programı veya insan mühendisleri hizmet etmek için tasarlandığını, AI için değil olduğunu güçlü bir şekilde inanıyorum. Bu, insanlar için tasarlanmış bir arayüzün üzerine bir Agent bağlantısı eklemek gibi bir şey; bu yöntem, insan operasyon kapasitesiyle Agent'in potansiyelini sınırlıyor.
Örneğin, Agent milisaniye düzeyinde düşünüp görev başlatabilir, ancak K8s (kubernetes) gibi alt seviye yetenekler bu amaç için hazır değildir, çünkü insanlar genellikle dakika düzeyinde görev başlatır. Bu nedenle daha ileri bir yeteneğe ihtiyacımız var; bunu “Agentic Infra” yani “zekâlı token fabrikası” olarak adlandırıyoruz ve bu, Wuwen Xinqiong’un yaptığı iş.
Daha uzun vadeli olarak, gerçek AGI çağının başladığı anda, altyapının kendisinin bile bir varlık olması gerektiğini düşünüyoruz. Oluşturduğumuz bu fabrika, kendini geliştirebilen, kendini yenileyebilen ve bağımsız bir organizma oluşturabilen bir yapı olmalıdır. Bu, bir CEO'ya sahip olmakla eşdeğerdir; bu CEO, OpenClaw gibi bir Agent olabilir ve tüm altyapıyı yönetir, ardından AI müşterilerinin ihtiyaçlarına göre kendi ihtiyaçlarını belirler ve altyapıyı günceller. Böylece AI ile AI arasında daha iyi bir uyum sağlanabilir. Agent'lar arasında daha iyi iletişim kurma ve Cache to Cache gibi yetenekler geliştirme gibi bazı araştırmalar da yapıyoruz.
Bu yüzden sürekli düşündüğümüz şey, altyapı ve yapay zekânın gelişiminin izole bir durum olmaması—sadece bir talep geldiğinde onu gerçekleştirmek değil, çok zengin kimyasal tepkimeler yaratmak. Bu, gerçekten anlamda yazılım-hardware iş birliği, algoritma ve altyapı iş birliğidir ve Wuwen Xinqiong'un her zaman gerçekleştirmek istediği misyondur. İlginiz için teşekkür ederiz!
05. Verimlilik için ödün veren yenilikler de anlamlıdır, DeepSeek yerli takıma cesaret ve güven kazandırdı
Yang Zhilin: Sonra Fuli'ye bir soru sormak istiyorum. Xiaomi, yeni bir model yayınlamak ve arka plandaki teknolojiyi açık kaynak hale getirmek suretiyle topluluğa büyük bir katkı sağladı. Xiaomi'nin büyük modeller konusunda hangi benzersiz avantajlara sahip olduğunu düşünüyorsunuz?
Luo Fuli: Xiaomi'nın ne gibi benzersiz avantajları olduğunu bir kenara bırakıp, Çin'de büyük modeller geliştiren ekiplerin genel avantajı üzerine konuşmak istiyorum. Bu konunun daha geniş bir değeri olduğunu düşünüyorum.
Yaklaşık iki yıl önce, Çin'in temel model takımı, sınırlı hesaplama gücüne, özellikle bazı NVLink bağlantı bant genişliği kısıtlamalarına rağmen, bu düşük hesaplama gücünün sınırlarını aşmak ve DeepSeek V2, V3 serisi ile MoE, MLA gibi görünüşte “verimlilik için uzlaşmalar” yapan model yapıları geliştirmeye başladı.
Ancak daha sonra bu yeniliklerin, sabit hesaplama gücü altında en yüksek zekâ seviyesini nasıl maksimize edeceğimiz konusunda bir dönüşüm yarattığını gördük. Bu, DeepSeek'in tüm yerel temel model takımlarına cesaret ve güven verdi. Bugün, yerel çiplerimiz, özellikle çıkarım çipleri ve eğitim çipleri, bu sınırlamalardan etkilenmiyor olsa da, tam olarak bu sınırlamalar altında, daha yüksek eğitim verimliliği ve daha düşük çıkarım maliyeti sağlayan yeni model yapıları için arayışlar başlamıştır.
Son zamanlarda ortaya çıkan Hybrid Sparse, Linear Attention gibi yapılar, örneğin DeepSeek'in NSA'sı, Kimi'nin KSA'sı ve Xiaomi'nin bir sonraki nesil yapıya yönelik HySparse'i, MoE neslinden farklı olarak Agent çağına yönelik model yapıları yenilikleridir.
Neden yapısal yenilikleri bu kadar önemli buluyorum? Aslında OpenClaw’ı gerçekten kullanırsanız, ne kadar çok kullanırsanız o kadar daha iyi ve daha akıllı hale geldiğini fark edersiniz. Bu durumun öncül koşullarından biri, çıkarım bağlamının uzunluğudur. Uzun bağlam, uzun süredir konuştuğumuz bir konu; ancak şu anda uzun bağlamda çok iyi performans gösteren, güçlü olan ve çıkarım maliyeti düşük olan modeller var mı?
Aslında birçok model, 1M veya 10M bağlamı işlemekten değil, 1M ve 10M bağlamı çıkarım yapmanın maliyetinin çok yüksek ve hızının çok yavaş olmasından dolayı bu boyutları işleyemiyor. Sadece maliyet düşürüldüğünde ve hız artırıldığında, gerçekten yüksek verimlilik değeri taşıyan görevler modele verilebilir ve bu uzun bağlam içinde daha yüksek karmaşıklıktaki görevler tamamlanabilir, hatta modelin kendini yenilemesi sağlanabilir.
Modelin kendi kendini yinelemesi, karmaşık bir ortamda uzun bağlam kullanarak kendi kendini geliştirmesidir. Bu gelişme, Agent çerçevesi üzerinde olabilir ya da model parametreleri üzerinde olabilir—çünkü benim görüşüme göre bağlam kendisi aslında parametrelerin bir gelişimidir. Dolayısıyla uzun bağlamlı bir mimari nasıl oluşturulur ve çıkarım sırasında uzun bağlamlı verimli çıkarım nasıl sağlanır, bu tamamen kapsamlı bir rekabettir.
Yukarıda bahsettiğim gibi, uzun bağlam verimliliği için önceden eğitilmiş aşama yapısını hazırlamak—bu sorunu yaklaşık bir yıl önce keşfetmeye başladık. Şimdi, uzun mesafeli görevlerde kararlılık ve yüksek üst sınır etkilerini gerçekleştirmek, sonrası eğitim aşamasında geliştirdiğimiz yenilikçi bir paradigmadır.
Daha etkili öğrenme algoritmaları nasıl oluşturulur, 1M, 10M, 100M bağlamda gerçek ortamlardan uzun vadeli bağımlılıklara sahip metinler nasıl toplanır ve karmaşık ortamlardan üretilen iz verileri nasıl birleştirilir? Bunlar, son eğitim sırasında yaptığımız işler.
Ancak daha uzun vadeli olarak, büyük modellerin kendilerinin hızlı ilerlemesi ve Agent çerçevesinin desteklemesiyle,立雪'nin de belirttiği gibi, son dönemde çıkarım talebi yaklaşık on kat arttı. Peki bu yıl toplam token kullanımının 100 katına ulaşması mümkün mü?
Burada başka bir boyutun rekabetine giriliyor—hesaplama gücü, ya da çıkarım çipleri, hatta daha da aşağıya enerjiye kadar. Bu yüzden, eğer hep birlikte bu sorunu düşünürsek, belki sizden daha fazla şey öğrenebilirim. İlginiz için teşekkür ederiz!
06. Agent'in üç ana modülü vardır; çok Agent patlaması etki yaratacaktır
Yang Zhilin: Çok değerli bir paylaşım. Şimdi Huang Chao'ya bir soru sormak istiyorum: Nanobot gibi etkili bir Agent projesi geliştirdiniz ve birçok topluluk takipçiniz var. Agent'in altyapısı veya uygulama düzeyinden bakıldığında, sizce önümüzdeki dönemde dikkat edilmesi gereken ve önem taşıyan teknik yönler nelerdir?
Huang Chao: Agent teknolojisini soyutlarsam, anahtar modüller Planning, Memory ve Tool Use olur.

Öncelikle Planlama hakkında konuşalım. Şu anda sorun, özellikle 500 adım veya daha uzun adımları içeren uzun vadeli görevlerde veya çok karmaşık bağlamlarda birçok modelin iyi bir planlama yapamamasıdır. Temelde, modelin bu tür gizli bilgilere sahip olmayabileceğini düşünüyorum, özellikle bazı karmaşık dikey alanlarda. Bu nedenle, gelecekte çeşitli karmaşık görevlerin bilgilerinin modele sabitlenmesi gerekebilir; bu bir yön olabilir.
Elbette, Beceri ve Harness, kaliteli Beceri sağlayarak Planning'den kaynaklanan hataları kısmen azaltıyor ve modeli daha zor görevleri tamamlamaya yönlendiriyor.
Memory hakkında tekrar konuşalım. Memory, bilgi sıkıştırmasının doğruluksuz ve aramanın eksik olduğu izlenimini verir. Özellikle uzun vadeli görevler ve karmaşık senaryolarda Memory'nin yükü büyük ölçüde artar. Şu anda OpenClaw gibi projelerde, insanlar aslında en basit dosya sistemi tabanlı Markdown formatlı Memory kullanıyor ve bunu paylaşım dosyaları aracılığıyla yapıyorlar. Gelecekte Memory, katmanlı bir tasarıma doğru ilerleyebilir ve daha evrensel hale getirilmesi gerekecektir.
Dürüst olmak gerekirse, şu anki Bellek mekanizması genellemek için zor—çünkü Kodlama senaryoları, Derin Araştırma senaryoları ve çok modlu senaryoların veri modları büyük ölçüde farklı; bu Bellekler için iyi bir arama ve indeksleme yapmak aynı zamanda verimliliği korumak her zaman bir denge meselesidir.
Ayrıca, OpenClaw artık Agent oluşturma engelini büyük ölçüde düşürdükten sonra, gelecekte bir "ıstırap"tan fazlası olabilir. Kimi'nin de Agent Swarm gibi bir mekanizma ortaya çıktığını görüyorum; gelecekte herkesin "bir sürü ıstırap" olabilir.
Tek bir yengeç yerine bir grup yengeçin getirdiği bağlam artışı hayal edilebilir ve bu, Bellek üzerinde çok büyük bir baskı yaratır. Şu anda, özellikle karmaşık Kodlama, bilimsel keşifler gibi senaryolarda, bu “bir grup yengeç” nedeniyle oluşan bağlamı yönetmek için iyi bir mekanizma henüz yoktur; hem model hem de tüm Agent mimarisi üzerindeki baskı büyük.
Tool Use, yani Skill konusunda tekrar konuşalım. Skill'in şu anki sorunları, aslında MCP'nin başlangıçtaki sorunlarına benziyor—MCP zamanında kalite güvencesi ve güvenlik riski gibi sorunlar vardı. Şimdi de Skill için aynı durum geçerli: görünürde birçok Skill var, ancak kaliteli olanlar az; düşük kaliteli Skill'ler, Agent'in görevleri tamamlama doğruluğunu etkiliyor. Ayrıca kötü niyetli enjeksiyon sorunu da var. Bu nedenle Tool Use açısından, tüm Skill ekosistemini daha iyi hale getirmek için topluluk katkısına ihtiyaç var; hatta Skill'lerin yürütme süreci sırasında kendiliğinden yeni Skill'ler geliştirmesine izin verilmeli.
Genel olarak, Planlama, Bellek ve Araç Kullanımı, mevcut Agent'ların yaşadığı bazı sorunlardır ve geleceğin olası yönleridir.
07. Gelecek 12 ayın anahtar kelimeleri: ekosistem, sürdürülebilir token, kendini geliştiren ve hesaplama gücü
Yang Zhilin: İki konuk, görev karmaşıklığı arttıkça bağlamın nasıl patladığını farklı bakış açılarından tartışıyor. Model düzeyinde yerel bağlam uzunluğu artırılabilir; Agent Harness düzeyinde, Planlama, Bellek ve Çoklu-Agent gibi mekanizmalar, belirli model yetenekleriyle daha karmaşık görevleri destekleyebilir. Bu iki yönün ileride daha fazla kimyasal tepkime yaratacağını ve görev tamamlama kapasitesini daha da artıracağını düşünüyorum.
Son olarak, bir açık uçlu bir vizyonla bitirelim. Lütfen sonraki 12 ay içinde büyük modellerin gelişim trendini ve beklentilerinizi bir kelimeyle tanımlayın. Bu sefer Hwang Chao ile başlayalım.
Huang Chao: AI alanında 12 ay çok uzak gibi görünüyor, 12 ay sonra nasıl bir gelişim olacağını bilmiyorum.
Yang Zhilin: Burada orijinal olarak beş yıl yazıyordu, ben değiştirdim.
Huang Chao: Evet, hah. Düşündüğüm bir kelime "ekosistem". Şu anda OpenClaw herkesi oldukça harekete geçirdi, ancak gelecekte Agentler sadece eğlence amaçlı veya yeni bir deneyim olarak değil, gerçek bir "çalışan" olmalı. Gelecekte bunun gerçekten köklü bir şekilde yerleşip,搬砖 aracına ve gerçek bir iş ortağına dönüşmesi gerekir.
Bu, tüm ekosistemin çabasını gerektirir, özellikle开源 olarak teknoloji araştırmalarını ve model teknolojilerini açık hale getirdikten sonra, modelin geliştirilmesi, Skill platformunun geliştirilmesi ve çeşitli araçların tümüyle karideslere daha iyi hizmet edecek şekilde ekosistemi birlikte inşa etmek gerekir.
Geleceğin yazılımları hâlâ insanlar için mi olacak? Gelecekte birçok yazılımın insanlara yönelik olmayabileceğine inanıyorum—çünkü insanlar GUI gerektirirken, gelecek Agent yerel kullanım için olabilir. İlginç olan, insanların sadece kendilerini mutlu eden GUI'leri kullanmalarıdır. Şu anda tüm ekosistem, GUI ve MCP'den CLI modeline geçiş yapmaktadır. Bu, ekosistemin yazılım sistemlerini, verileri ve çeşitli teknolojileri Agent yerel forma dönüştürmesini gerektirir; böylece gelişim daha zengin hale gelir.
Ro Fuli: Soruyu bir yıla indirmek çok anlamlı. Beş yıl ise, AGI tanımım açısından zaten gerçekleştirilmiş durumda. Bu nedenle, sonraki yılın AGI yolculuğunda en kritik olayı bir cümleyle ifade edersem, bunun “kendini geliştirmek” olduğunu düşünüyorum.
Bu terim biraz mistik gibi görünüyor ve geçen yıl birçok kez bahsedildi. Ancak son zamanlarda bununla ilgili daha derin bir anlayış kazandım, ya da “kendi kendine evrimleşme”nin nasıl yapılacağına dair daha pratik ve uygulanabilir bir yöntem buldum. Nedeni ise güçlü modeller elde ettikten sonra, Chat paradigmaları altında önceden eğitilmiş modellerin sınırlarını tam olarak kullanamadık; ancak Agent çerçevesi bu sınırı aktif hale getirdi. Modeli daha uzun süreli görevler için çalıştırdığımızda, kendi kendine öğrenip evrilebileceğini gördük.
Basit bir deneme: Var olan Agent çerçevesine doğrulanabilir bir koşul ekleyin ve modelin hedefi sürekli olarak iyileştirmesi için bir döngü oluşturun; böylece daha iyi çözümler ürettiğini göreceksiniz. Bu kendini geliştiren süreç, görevin zorluğuna bağlı olarak şu anda bir ila iki gün boyunca çalışabiliyor.
Örneğin, daha iyi model yapıları keşfetme gibi bazı bilimsel araştırmalarda, model yapılarının düşük PPL gibi değerlendirme kriterleri vardır. Bu belirli görevlerde, bunun zaten iki ila üç gün boyunca kendi kendine optimize edip gerçekleştirebildiğini gördük.
Bu nedenle benim bakış açımdan, kendini geliştirme, yalnızca "yeni şeyler yaratma" noktasıdır. Mevcut insan üretkenliğini değiştirmiyor, dünyada henüz olmayan şeyleri keşfetmek için en üst düzey bilim insanları gibi davranıyor. Bir yıl önce bu zaman çizelgesinin üç ila beş yıl kadar uzun olacağını düşünüyordum, ancak son zamanlarda bunun gerçekten bir ila iki yıla indirilebileceğini düşünüyorum. Yakında büyük modelleri güçlü bir kendini geliştirme Agent çerçevesiyle birleştirebilir ve bilimsel araştırmalarda en azından üssel bir hızlanma sağlayabiliriz.
Son zamanlarda, grubumuzda büyük modeller üzerinde çalışan öğrencilerin iş akışlarının yüksek derecede belirsiz ve yaratıcı olduğunu fark ettim; ancak Claude Code ve en iyi modelleri kullanarak araştırmalarımızın verimliliğini yaklaşık on kat artırdık. Bu paradigmayı daha geniş disiplinlere ve alanlara yayılmasını bekliyorum, bu yüzden "kendi kendini geliştirmenin" çok önemli olduğunu düşünüyorum.
Xia Lixue: Anahtar kelimeşim "sürdürülebilir token". Tüm AI gelişiminin uzun vadeli bir süreçte olduğunu görüyorum ve bunun uzun ömürlü olmasını istiyoruz. Altyapı açısından büyük bir sorun, kaynakların nihayetinde sınırlı olmasıdır.
Sürdürülebilir kalkınma konuşulurken olduğu gibi, bir token fabrikası olarak, öncü modellerin daha fazla alt hizmete hizmet edebilmesi için tokenları sürdürülebilir, kararlı ve büyük ölçekli bir şekilde sağlayabilmemiz, bizim için çok önemli bir sorun.
Görüşümüzü tüm ekosisteme genişletmemiz gerekiyor—enerjiden hesaplama gücüne, ardından tokenlere ve nihayetinde uygulamalara kadar sürdürülebilir bir ekonomik yineleme oluşturmak için. Yalnızca yerel hesaplama gücünü kullanmakla kalmayacak, aynı zamanda bu yetenekleri yurtdışına da aktararak küresel kaynakların birbirine bağlanmasını ve entegre edilmesini sağlayacağız.
Ben de “sürdürülebilir”in, Çin özel token ekonomisini kurmak olduğunu düşünüyorum. Geçmişte Made in China dedik, Çin’in düşük maliyetli üretim kapasitesini küresel pazarlara iyi ürünler olarak sunduk.
Şu anda yapmamız gereken, “Çin’de Üretilen AI” — Çin’in enerji ve diğer alanlardaki üstünlüklerini, token fabrikası aracılığıyla sürdürülebilir bir şekilde kaliteli tokenlere dönüştürmek ve bunları küresel ölçekte dışa aktararak dünyanın token fabrikası olmak. Bu, bu yıl Çin’in dünyaya sunacağı yapay zeka değerini görmek istediğim şey.
Zhang Peng: Biraz daha kısa olacağım. Hepiniz gökyüzüne bakıyor, ben biraz daha zemine iniyorum. Anahtar kelimesi "hesaplama gücü".
Daha önce de belirtildiği gibi, tüm teknolojiler ve agent çerçeveleri yaratıcılığınızı ve verimliliğinizi on kat artırdı, ancak bunu gerçekten kullanabiliyorsanız. Bir soru sorduğunuzda, uzun süre düşünmesine izin verip cevap vermezseniz, bu kesinlikle mümkün değil. Bu nedenle, birçok araştırma ilerlemesi ve yapmak istediğiniz birçok şey engelleniyor.
İki yıl önce, Çongdiyan Forumu'nda bir akademisyenin şöyle bir söz söylediğini hatırlıyorum: “Kart yok, duygular yok; kart konuşmak duygulara zarar verir.” Bugün yine bu noktadayız, ancak durum farklı. Şimdi çıkarım aşamasına girdik ve talep gerçekten patlıyor — on kat, yüz kat artıyor. Daha önce on kat arttığını söylediniz, ancak talep aslında yüz kat olabilir mi? Ve hâlâ karşılanmamış çok sayıda talep var, ne yapacağız? Hepsini birlikte düşünmeye çalışalım.
