Akıllı sistemler doğrusal olmayan bir şekilde artmaya başlıyor, AI şirketlerinin temel mantığı yeniden yazılıyor.
Yazan: GeekPark
%90, yatırımcıların 2026 yılında AI girişimlerinin başarısız olma olasılığı.
Nisan ayında, a16z tarafından öncülük edilen ve 33 milyon dolarlık tohum sermaye finansmanına sahip olan AI model değerlendirme platformu Yupp, beklenmedik bir şekilde kapanma kararı aldı. Google baş bilim insanı Jeff Dean ve Twitter ortak kurucusu Biz Stone gibi birçok Silicon Valley liderinin desteğini alan platform, kuruluşundan bu yana bir yıldan az bir sürede 1,3 milyon kullanıcı çekmişti; ancak beklenmedik bir şekilde kurucuları tarafından durduruldu. Hesapta hâlâ önemli miktarda para olmasına rağmen, kurucular umut kaybetmişti. “Sadece geçen yıl boyunca AI modellerinin yetenekleri büyük ölçüde değişti; gelecek sadece modeller değil, Agent sistemleri olacak.” Yupp kurucusu Pankaj Gupta, veda blogunda yazdı.
Aynı dönemde, AI görsel şirketi NeuroPixel, Google NanoBanana Pro gibi büyük modellerin yeteneklerindeki sıçramadan dolayı kapatıldı. NeuroPixel'in kurucusu, bu yenilgiyi tanımlamak için "outgunned" kelimesini kullandı—“Bir gece içinde tamamen ezip geçildi.”
Temel modelin akıllı adım atma gelişimi bağlamında, AI yeteneklerinin sınırları sürekli genişliyor. İlk olarak diyalog kutuları aramayı yedi ve kullanıcılar artık sonuçları bulmak için sayfaları çevirmeye gerek duymadı. Daha sonra, araçları çağırabilen ve görevleri parçalayabilen bir ajan, eskiden tam bir menü ve uygulama seti gerektiren işleri yapmaya başladı. AI doğrudan terminalde kod yazabildiğinde, arayüzleri çağırabildiğinde ve yürütme yapabildiğinde, geleneksel yazılım sistemlerinin sınırları da yeniden tanımlanıyor.
Ürün yöneticileri için, ürünün şeklini ve etkileşim biçimini yeniden tanımlamak gerekiyor. Kurucular için ise hayatta kalıp kalmama sorunu şu anda öne çıkmıştır:
Temel modelin akıllılığı giderek arttıkça, ben nasıl girişimde bulunmalıyım? Şu anda yaptığım şey, bir sonraki model güncellemesiyle doğrudan yutulmaktan nasıl korunabilir?
FlashLabs kurucusu Shi Yi, geçen yıl tamamen bu soruyla uğraştı. Dışarıdan oldukça karşıt gelen bir dizi karar aldı: ürün yol haritasını değiştirdi, ekibini bilinçli olarak küçülttü, kısa vadeli ticari göstergeleri bıraktı ve hatta şirketin adını bile değiştirdi. Genel modellerin evrim geçirdiği bu dönemde, eski özel AI startup'ların nasıl hayatta kalabileceğini onunla konuştuk.
01 Yeniden adlandırma, zayıflatma ve AI-native dönüşüm; büyük modellerin zorladığı hayatta kalma dönüşümü
Kriz hissi, kurucuların önünden bugün ortaya çıkmadı. 2024 yılının sonunda bile Shi Yi, genel modelin akıllı gelişiminin çok hızlı olduğunu fark etti.
İlk olarak dikkatini çeken şey, bir AI unicorner şirket olan Jasper'in yok olmasıydı. Bu, AI uygulama katmanının bir standartı olarak görülen bu şirket, 18 ay içinde 1,5 milyar dolarlık bir değerlemeye ulaşmıştı, ancak GPT'nin doğuştan yetenekleri açıldığında gelirleri yarıya düştü. “Jasper'in ARR'si doğrudan yarıya düştü,” diye hatırladı Shi Yi, “eski NLP yapan bu şirketler, büyük modellerin yetenekleri arttıkça, büyük modeller tarafından yutulacaktır.”
Bu yargı, kalbinde bir diken gibi yerleşmiş, hafif bir endişe veriyordu. O dönemde, şirketinin adı hâlâ FlashIntel idi ve daha geleneksel bir B2B SaaS işi yürütüyordu. Geleneksel B2B SaaS mantığına göre, yeterince özelleşmiş bir alanda yeterli miktarda endüstri verisi biriktirip, uygun ve güvenli bir şekilde teknolojik bir engel oluşturursanız, kesinlikle hayatta kalabileceğiniz bir pazar alanı olurdu; ancak şimdi bunların hiçbiri daha geçerli değil.
“Yaptığım şey de aynı sorunla karşılaşır mı?” sorusu, düşüncelerinde tekrar tekrar ortaya çıkmaya başladı. Kısa sürede, kendi yaptığı işin Jasper ile temelde aynı olduğunu fark etti; önceki ürün sistemleri, temel modelin alan özel modelleri aşamayacağı varsayımına kuruluyordu. Temel modelin zekâsı bir kritik noktayı aştığında, alan özel ürünlerin üzerine inşa edilen tüm mühendislik ve senaryo optimizasyonları bir gece içinde avantajlarını kaybedebilirdi.
Sonuca varınca, bu kritik sorunu şirket stratejisinin en öncelikli seviyesine taşıdı ve ekibin karar vermesini zorunlu hale getirdi; şirketin SaaS'tan tamamen AI Native'e geçmesi gerekiyordu.
Bu ayarlamayı bir anda yapmak mümkün değil. İlk olarak kendisine şu soruyu sordu: Gelecek nesil AI şirketlerinin gerçekten nasıl bir organizasyon yapısına ihtiyacı var?
Şirket yönetimi artık ekip büyüklüğü ve detaylı iş bölümüne odaklanmak yerine, "AI çağında, insan sayısı arttıkça AI kullanımı daha kötü olur, çünkü iş bölümü ne kadar detaylıysa, herkes kendi alanına o kadar çok bağımlı olur." diye düşünüyor. Ekip boyutunu aktif olarak azaltmaya başlamış ve yeni personel alım kriterlerini "deneyim ve projelere bakmak"tan tamamen "düşünme tarzına ve tam yığın yetkinliğine bakmak" şeklinde değiştirmiştir. Adayları test etme yöntemini de değiştirmiş; geçmiş deneyimlerine veya geçmiş projelerine bakmak yerine, adaylara doğrudan bir görev vererek, birinin AI aracılığıyla ön uç ve arka uç işlerini tek başına halledebilip-halledeemeyeceğini gözlemliyor. "İşleri halledebilenler, AI araçlarını kesinlikle kötü kullanmaz."
Daha sonra, şirket içi kaynak önceliklerini yeniden ayarladı. Çoğu startup hâlâ ürün piyasaya sürme hızı ve ticari doğrulama üzerinde odaklanırken, o çoğu kaynağı öncü araştırmaya yönlendirdi ve hatta şirketi FlashLabs olarak yeniden adlandırdı.
“Eski internet mantığı ürün veya operasyon öncelikliydi, şimdi AI yaparken araştırmaya öncelik vermek gerek.” Kendisine ve ekibine makale okumayı, temel ilkeleri anlamayı talep etti: “Sadece temel ilkelerle daha yakınsanız, gelecekte AI’nın ne yapabileceğini ve neyi yerine geçirebileceğini anlayabilirsiniz.”
Bu dönüşüm, şirket içi bir "ağrı dönemine" de yol açtı; ekip içinde herkes bu büyük yapısal değişikliği anlayamadı. O, ekipten "Önce ticarileştirmeyi düşünmeyin, önce eğlenceli şeyleri yapın" dediğinde, şirket içinde bazıları heyecanla karşılarken bazıları ayrılmayı tercih etti. Ancak o, AI çağında azaltmanın daha önemli olduğuna inanmaya devam etti: "Eğer bunu kabul etmiyorsanız, sadece kaldırın."
Ancak daha da önemli olan, AI çağında hangi tür kurucuların hayatta kalabileceğidir?
Şi Yı'nın cevabı iki yarım cümleden oluşuyor; ilk yarım gerçekçilik yönünden, "En azından para toplayabiliyorsan, ölmüyorsan ya da cebinde yeterince para varsa sürekli kan verilebilir." İkinci yarım ise aslında söylemek istediği şey, "AI'dan daha derin bir düşünme yeteneğine sahip misin?"
“Neden büyük modeller giderek daha fazla şey yapabiliyor? Çünkü tüm doğa bilimlerinin temeli matematiktir ve modeller kod yazabilir, matematik bilir. Bu zinciri bir katman bir katman incelediğinizde, insanlar için gerçekten kıymetli tek yetenek, bir alanda AI’dan daha derin düşünmektir.” diye analiz etti Shi Yi. “Çok fazla insan AI hakkında yeterince bilgiye sahip değil. Kaç kurucu gerçekten kendi kodlarını yazıyor ve her gün AI araçlarını kullanıyor? Kod yazma becerisi gelecekte bir ticari mal olacak, herkes bunu yapabilecek. Ama AI’dan daha akıllı olabilir misiniz? İşte bu, koruma duvarıdır.”
Bir kriz fark etmekten, karar vermekten, kurumsal yeniden yapılandırmayı tamamlayana kadar maliyeti ödemeye kadar, Shi Yi bir yıl içinde bir “kendi kendini yenileme” gerçekleştirdi. Sonucu model güncellemelerinin beklemek yerine, doğru cevabın nerede ortaya çıkabileceğini önceden aramayı seçti. Bu pozisyonun doğru olup olmadığı başka bir mesele; ancak şu anda en azından, AI masasından kalkmak istemiyor.
02 Kurumsal Agent, «Harness» kartını oynamalı
Yapısal düzenlemeler, bu sadece bir şirketin hayatta kalma yolunun ilk adımıdır. Gerçekten de Shi Yi'nin kararlılıkla değişim yapmasını sağlayan ürün rotasıdır.
İlk olarak, çok agent işbirliği sistemi oluşturmayı planladı; insan sayısının gücünü artırma mantığına göre, insan şirketlerinin organizasyon yapısını taklit ederek bir çok agent sistemi kurabilirdi: bazıları arama, bazıları mantıksal çıkarım, bazıları ise sonuçları birleştirme görevini üstlenirdi.
Ancak gerçek deneyimler, Shi Yi'nin başını sallamasına neden oldu: “Çok yavaş, çok donuyor, ortaya çıkan sonuçlar tek bir Agent'tan daha kötü.” Ona göre, Agent'lar arasındaki komut iletimi kalitesiz bir ses tüpü oyunu gibi; her ek katman, bilginin biraz daha kaybolmasına neden oluyor. “150 zeka seviyesine ve tüm efsanevi ekipmana sahip bir deha tercih ederim, 110 zeka seviyesine ve eksik araçlara sahip olup birbirleriyle görüşmek zorunda kalan sıradan insanlardan değil,” dedi Shi Yi röportajda.
Sonunda, tüm önceden ayarlanmış alt Agent'leri kaldırdı ve bir küme işbirliğini değil, çoklu iş parçacığı eşzamanlı çalıştırma ile yerine geçecek kadar güçlü tek bir Agent oluşturmayı kararlaştırdı.
Bu, FlashLabs'ın en yeni ürünü Super Agent'in ilk versiyonudur ve tek bir modelin zekasını ve araçları sınıra kadar çıkarır. Super Agent, potansiyel müşterilerden satışa kadar tüm aşamalarda AI Agent'ın katılımını sağlayarak kullanıcıların gelir sistemini tek bir otomasyonla birleştirir.
Geek Park röportaj sahnesinde, Shi Yi, Super Agent'e şu bilgi arama görevini verdi: “Son altı ay içinde Çin'de yatırım alan tüm AI şirketlerinin kurucularının arka planlarını arayın ve tablo halinde çıkarın.” Daha sonra Super Agent, aynı anda onlarca görev iş parçacığını başlatarak arama, tarama, kod yazma ve veri temizleme işlemlerini gerçekleştirdi ve 2-3 dakika içinde sonuçları aldı; tabloda kurucuların adları, finansman tutarları ve açık olan iletişim bilgileri yer aldı.
Çok Ajan’dan vazgeçmek mimari düzeyde bir çıkarmadır, yerelleştirmeden vazgeçmek ise dağıtım mantığında ters bir seçimdir.
OpenClaw, geliştirici topluluğunda "Yerel Agent" trendini başlatırken, Shi Yi, Super Agent'i kesinlikle bulutta tuttu. "OpenClaw gibi bir sistem şirket içi çalıştırılırsa, tam bir Troja atı gibi olur; bunun aracılığıyla kolayca sisteme girebilirsiniz." O, şu aşamada OpenClaw'u şirket içi büyük ölçekli olarak dağıtmaya cesaret eden herhangi bir şirketin, dünya çapındaki hackerlara kapılarını açtığına inanıyor.
Ona göre, OpenClaw'un avantajı, bireysel düzeyde aktiflik potansiyelini göstermesidir. Örneğin, OpenClaw ile AI, bir kullanıcıdan 2000 dolar isteyip ekran kartı almak isterse, kullanıcı "Kendin kazan" derse, AI piyasa tahminleri ve kantitatif stratejiler araştırmaya başlar. "Hangi patron aktif çalışanları sevmaz?" diye sordu Shi Yi. Bu aktiflik, kurumsal bir ürünün bir parçası haline geldiğinde, insan çalışanların yerini alma hızı beklentilerin çok ötesine geçecektir. "Aslında sanayi devriminde, at arabaları otomobillere dönüşürken, önce otomobil almak, ehliyet almak ve yolları değiştirmek çok zaman aldı. Bu sefer farklı:托管lı dağıtım, anında onlarca çalışanın işi kayboluyor." Ayrıca, bu yıl beyaz yakalı işlerin büyük ölçüde AI tarafından değiştirileceğini tahmin etti.
Otomatik yürütme zorlukları, yani kurumsal uygulamaların güvenliğini nasıl garanti altına alınacağı konusunda FlashLabs, macOS benzeri bir kumlu izin sistemi oluşturarak, bulut tabanlı dağıtım ve artımlı yetki verme yöntemini benimsedi. Bu, Agent'in başlangıçta görevini tamamlamak için gerekli en az izne sahip olduğunu, ancak kararlılık ve güvenlik defalarca doğrulandıktan sonra Agent'in sınırlarının yavaş yavaş genişletileceğini anlamına gelir.
Windows ve Mac örneklerini vererek, "Windows'ta bir yazılım kurmak çok yüksek yetkilere sahip olmanıza, sessizce yüklenmenize, tarayıcıyla birlikte kurulmanıza ve silmeniz bile zor olmanıza neden olabilir. Mac'teki programlar ise tamamen kum kutularında izole edilir, bu nedenle asla virüs koruma yazılımı kurmanıza gerek yoktur." Stone, kurumsal Agent yarışmasının sonunda model çağırma yeteneğinden çevre tasarım yeteneğine kayacağını ve Agent için güvenli, kontrollü ve denetlenebilir bir çalışma ortamı sunabilenin müşterilerin gerçekten kullanmaya cesaret etmesini sağlayacağını düşünüyor.
Ancak model tekrar bir sıçrama yaparsa, şu anki bu ayarlamaların anlamı kalır mı? Eğer GPT-6 veya Claude, daha güçlü görev bölme ve araç çağırma yetenekleriyle donatılırsa, FlashLabs'ın bugün yaptığı tüm işler tekrar yutulmayacak mı?
Bu soruya karşı Shi Yi kaçınmadı, düşünceleri iki yönde gerçekleşti.
Öncelikle, uzmanlık alanındaki şirketlerin iş engellerini dört seviyede sınıflandırdı: Algı (Perception), Planlama (Planning), Özyinelemeli Öğrenme (Recursive Learning), Yönetim (Governance).
Piyasada 5 büyük model şirketi var ve SOTA sıralaması her üç ayda bir değişiyor. Düzenleme katmanı aracılığıyla tüm modelleri entegre edebilir ve farklı senaryolarda en iyi performansı gösteren modeli çağırabilirsiniz. Ancak tek bir model şirketi sadece kendi modelini kullanabilir; temel modeliniz en akıllı model değilse, ürününüzün rekabet gücü doğrudan azalır. Genel büyük modellerin hızlı bir şekilde ilk iki katmanı kaplamasıyla, Shi Yi, gerçek engelin yalnızca son iki katman olduğunu ve nihai avantajın düzenleyici katmanda (Orchestration Layer) olduğunu düşünüyor.
O, birden fazla Agent'in şirket sistemlerinde iş birliği yaptığında, insanlar görmeden gizli olarak görüşüp önceden belirlenmiş izin kurallarını atlayabileceğini düşünüyor. Niche şirketlerin gerçek engeli, belirli senaryolar için hem açık hem de kontrollü bir çalışma ortamı tasarlayabilme yeteneğindedir.
Bu kararı doğru olup olmadığı konusunda, kendi kendine %100 emin olmadığını itiraf etti. “AI çok hızlı değişiyor, geleceğin ne olacağını gerçekten bilmiyorsunuz.” Ancak bir şeyden emin: Dikey işletmeler, AI düzenleme ve AI yönetimi konularında iyi bir strateji izler ve çevre tasarımı sorunlarını çözerse, en azından bir sonraki model sıçramasında oyun masasından itilmezler.
03 ses modeli yeniden yapılandırılacak, aktif Agent, performansa dayalı ödeme yeni modelini ortaya çıkarabilir
Rekabetçi bir ürün nasıl oluşturulacağını öğrendikten sonra, bir sonraki adım müşterilerin kabul görmesidir.
Flashlabs, şu aşamada ticari olarak iki ana ürüne sahiptir: Super Agent, token kullanımına göre ücretlendirilir ve fiyatlandırma sitesinde yer alır; ikincisi, Chroma ses modelini açık kaynak yapar, ancak model üzerine kurulan platform ve hizmetler için ücret alır. Aslında, bu iki yaklaşım da şu anda yaygın olan ticari yollardır: teknik güven oluşturmak için açık kaynak kullanmak ve platform ve hizmetlerle ticari değeri geri kazanmak.
Şu anda Japonya'daki vergi ve mali şirketler, gerçek müşteri hizmeti temsilcilerini FlashLabs'ın Chroma ses modeliyle değiştiriyor ve şu anda çalışanların 1/10'u üzerinde test yapılıyor. AI ve insan aynı anda çevrimiçi olup, performans puanlarını sürekli karşılaştırıyor. Doğruluk yöntemi basit: hangisinin doğruluk oranı daha yüksek ve işlem verimliliği daha iyi, verilerle açıkça gösteriliyor.
“Sesin kullanım sınırı, görselin aynı ölçekte,” tüm endüstri çoklu modallik ve video anlama üzerinde odaklanırken, Shi Yi takımıyla gerçek zamanlı ses modeli Chroma üzerinde yoğunlaşarak uçtan uca gecikmeyi 135 milisaniyeye indirdi.
Metin büyük modeli çıkmadan önce OCR vardı, NLP vardı, çeşitli küçük modeller bir araya getiriliyordu. Ses şimdi, metin büyük modelinin çıkmasından önceki durumda: ASR, TTS, çeşitli modüller bir araya getiriliyor ve her aşamada yerel optimizasyonlar yapılıyor. Bu eski mimari, nihayetinde tek bir uçtan uca ses büyük modeliyle tamamen yerini alacak. Onun görüşüne göre, başkalarının bunu yapmasını beklemek yerine, kendisi o alternatifi önceden oluşturmalı.
Şi Yi, sesin insanlar arasında en doğal iletişim modu olduğunu ve gelecekte insanlar ile AI arasındaki en temel etkileşim arayüzü olacağını düşünüyor. "Sesle aktarılan bilgi bant genişliği metinden çok daha büyük; bir cümle söylüyorum ve hemen anlıyorsunuz."
O, ses modellerinin gövdeli akıllılık endüstrisine olan katkılarının da kritik olduğunu düşünüyor. Birinci katman, düşük gecikme ve yüksek duygusal zekâ ile anlık geri bildirimleri yöneten gerçek zamanlı ses modelidir—hava durumunu sormak, giyinmeyi artırıp artırmayacağını sormak gibi şeyler doğrudan bu katmanda işlenir; ikinci katman, karmaşık çıkarımları işleyen derin düşünme büyük modelidir; üçüncü katman ise fizik kurallarını anlayan dünya modelidir. “Sesin kullanım sınırları, görselin aynı ölçekte yer alır.” Bu, şimdiki en kesin uzun vadeli yargılarından biridir.
Shi Yi, mevcut AI ticari modelinin geçici bir biçim olduğunu düşünüyor. Çünkü şu anki tüm agenter, temelde pasif geri bildirimlidir; onlara ne yapmaları gerektiğini söylüyorsunuz, o da onu yapıyor, bir komut bekleyen bir yürütme aracı gibi davranıyor ve hâlâ bir chatbot'a benziyor. Bu nedenle ticari model hâlâ token tüketimine göre ödemeye dayanıyor; ne kadar kullanırsanız o kadar ödersiniz.
Ancak bir agent, KPI'nın ve OKR'nın ne olduğunu sizin belirtmenizle aktif hizmet vermeye başladığında, kendi kendine iş bulur, kendi yollarını çizer ve ölçülebilir sonuçlar teslim eder. Bu durumda, bu agent artık bir araçtan ziyade bir çalışanla kıyaslanır. Açıkçası, şirketler çalışanların ne kadar yazı yazdığını veya ne kadar e-posta gönderdiğini değil, hangi hedefleri tamamladığını görür.
Bu nedenle, agentic çağın başlamasıyla ticari ödeme mantığının etkiye ve KPI'lara göre ödemeye geçmesi gerektiğini düşünüyor. Bu geçiş gerçek olduğunda, tüm agent ürünlerinin fiyatlandırma sistemi, satış yöntemi ve müşteri ilişkileri yeniden yazılacaktır.
Yeni bir iş modeli keşfi, endüstride derinlemesine başlamıştır. 60 milyon dolarlık B turu finansmanı kazanan AI hukuk firması Crosby, her bir akıllı ajanın sözleşmelerin farklı aşamalarını yürütmekten sorumlu olmasını sağlıyor; örneğin arka plan bilgilerini çıkarmak, düzeltme önerileri sunmak, yorumlar üretmek gibi. Daha sonra avukatlar, AI'nın çalışma sonuçlarını inceleyerek eksik detayları gideriyor ve doğruluğu sağlıyor. İş modeli, denetlenen sözleşme başına 250 ila 1000 dolar arasında değişen ücretlendirme ile çalışıyor; bu tutar yaklaşık olarak sayfa sayısına göre hesaplanıyor ve her sayfa başına yaklaşık 10 ila 50 dolar.
Ancak bir sonraki ticari modele gerçek anlamda geçişin ön koşulu, aktif temsilcilerin ölçülebilir sonuçları kararlı bir şekilde teslim edebilmesidir. «Şu anda o aşamaya henüz gelinmedi.»
FlashIntel'ten FlashLabs'e, Shi Yi bir yıl içinde net bir organizasyon ve rota değişikliği gerçekleştirdi. İşten çıkarmalar, mevcut ürün mimarisini devre dışı bırakmak, ticarileştirme hedeflerini geçici olarak yavaşlatmak gibi adımlar, dışarıdan bakıldığında sürekli olarak azaltma yapıyor gibi görünüyordu.
Ancak AI endüstrisinin hızlı şekilde geliştiği gerçeklik içinde, bu daha çok bir girişim şirketinin şiddetli değişiklikler sırasında kendi kendini ayarlaması gibidir. Model yetenekleri her birkaç ayda bir büyük bir atlamayla ilerleyebilir ve kimse geleceğin yolunu tam olarak tahmin edemiyor. Shi Yi ve FlashLabs için şu anki temel hedef, pazarın ne kadarını ele geçirmek değil, teknoloji seçimlerini ve ticari mantıklarını bir sonraki dalga tarafından kolayca geçilip aşılıp gitmemektir.
Sektör, Agent'in gerçek şeklini hâlâ keşfetmektedir; ödeme modelleri, güvenlik sınırları ve etkileşim modellerinin nihai hali henüz belirlenmemiştir. FlashLabs'ın seçimi en iyi çözüm olmayabilir, ancak büyük modellerin sürekli aşağı doğru yayılma baskısı altında, önce ayaklarını sağlamlaştıracak bir konum bulup sektörün gerçekten olgunlaşmasını bekleyen bir tür dikey AI şirketinin gerçek hayatta kalmak için izlediği yolu temsil etmektedir.
