Son zamanlarda insansı robotlar, “lüks ürün”den “pahsız ürün”e tarihi bir dönüşüm yaşadı.

Yazar ve kaynak: AI Öncü

Son zamanlarda, insansı robotlar “lüks ürün”den “pazar fiyatı”na tarihi bir dönüşüm yaşadı. Bir yıl önce yüz binlerce yuan ödenerek sıraya girilmesi gereken mühendislik örnekleri, şimdi ikinci el sitelerde ve parçalama pazarlarında “50.000 yuanla bir kamyon” olarak toplu olarak temizleniyor. Tekil fiyatlar bazında, bazıları yüksek uç model akıllı telefonlardan bile daha ucuza hale geldi.

Yutu G1, 85.000 yuan'dan başlamak üzere; tüketici seviyesi giriş modeli R1 Air sadece 29.900 yuan'a; Songyan Power'ın Bumi ürünü ise 9.998 yuan'a düşerek, yüksek konfigürasyonlu bir iPhone'dan daha ucuza gelmiştir. Aynı zamanda, Çinli insan benzeri robotların tedarik zinciri yerelleştirme oranı %90'ı aştı. Morgan Stanley'in en son yayınladığı rapora göre, 2025 yılında dünyada satılacak 13.000 ile 16.000 insan benzeri robotun yaklaşık %90'ı Çinli üreticilerden gelecektir.

Eğer şu anki yapay zekâ dijital dünyanın üretkenliğini üstlenmeye başlamışsa, hızla gelişen robotlar fiziksel dünyanın üretkenliği olma potansiyeline sahip. Ürün fiyatlarının "günde bin kilometre" ilerlediği bu heyecan verici ortamda bir soru ortaya çıkmaya başlamıştır: Gelecekte sadece insansı robotlar yeterli mi olacak?

Gartner'in araştırmasına göre, insan benzeri robotların "gerçekleşme oranı" sadece 1:60'dır; yaklaşık %98,36'sı hâlâ keşif aşamasındadır ve sadece %1,64'ü gerçek olarak uygulanmıştır. "Pratik veya rasyonel bir açıdan bakıldığında, gelecekteki robotların insanlara tamamen benzer görünmesi gerekmez," diyor Gartner araştırma başkanı Gao Ting.

Son zamanlarda Gao Ting ile röportaj yaptık. Röportajda, insan dünyasının insan boyutlarına göre tasarlandığını, ancak insan vücudunun robotlar için en iyi form olmayabileceğini belirtti. Başarılı robotlar, insan formunu basitçe kopyalamak yerine geliştirmelidir. Örneğin, Amazon'un test ettiği Digit robotu, dizleri geriye doğru bükülmüş olup, raf önlerinde insanlardan daha verimli şekilde çömelme yeteneğine sahiptir; 1X'in Eve robotu ise tekerlekli, kendini dengeli şasi kullanarak düz yüzeyli iç mekanlarda hareket verimliliğini artırır. Verimli robot formları köpeksiyse, tekerlekliyse veya tamamen görev gereksinimlerine göre tasarlanmış tamamen yeni formlar olabilir; bu formlar genellikle insansı formlardan daha kararlı, daha düşük maliyetli ve daha hızlıdır.

“İnsan benzeri dış görünüme sınırlanmayın; hızla değer sunan ve gelir oluşturan belirli dikey uygulama alanlarını öncelikli olarak arayın.” Bunun dışında, Gao Ting, robot endüstrisinin bugünün gerçek manzarasını teknoloji, donanım, uygulama alanları ve gerçek dünya zorlukları gibi birçok boyutta梳理 etti.

Bugün robotlar ne yapabilir?

Kısa vadeli olarak dikkat edilmesi gereken, “robotların insan gibi görünmesi” değil, “robotların çok net bir senaryoda stabil bir şekilde görevleri yerine getirip maliyetleri düşürmesi, insan kaynaklarına olan bağımlılığı azaltması ve operasyonel verimliliği artırması”dır.

Peki, bugün robotlar ne yapabilir?

Şu ana kadar uygulanan senaryolara bakıldığında, robotun nasıl göründüğü aslında en önemli değil. Hem depodaki robot kolları hem de otomobil fabrikalarındaki taşıma robotları, gerçekçi uygulama alanlarının ortak özelliği sabit bir ortama sahip olmalarıdır. Şirketlerin sonunda dikkat ettiği şey, bu robotun işi iyi yapıp yapamayacağı ve maliyetinin karşılanıp karşılanamayacağıdır, insan benzeri görünmesi değildir.

Yüksek düzeyde özetleme: Şu aşamada yatırım getirisi oluşturmak daha kolay olan robot senaryoları genellikle üç özellik taşır: görev sınırları net, süreçler tekrarlanabilir ve istisnai durumlar nispeten sınırlıdır. Örneğin, endüstriyel hat yakınındaki lojistik, khoz taşıma ve bazı hizmet süreçleri,現場 değişikliklerle robotun ele alması gereken karmaşıklığı azaltılabilir. Ev senaryoları ise farklıdır: görevler daha da dağılmış, çevre değişiklikleri daha sıklıkla gerçekleşir ve herhangi bir hata doğrudan insan güvenliğini etkileyebilir. Bu nedenle, ev robotları hem daha güçlü model yeteneklerine hem de daha olgun mühendislik güvenilirliği ve güvenlik mekanizmalarına ihtiyaç duyar.

Büyük ölçekli endüstriyelleşmenin pencere dönemi, fırsat nerede?

“Robotlar ölçeklenebilir endüstriye geçiş sürecinde bulunuyor.” Yüksek, robot endüstrisinin mevcut aşamasını böyle tanımlıyor. “Şu anda, robotlar bazı ticari ve endüstriyel senaryolarda başarıyla uygulanmıştır. Özellikle fabrikalarda ve depolarda, tekrarlayan görevlerde robotlar bazı insan işlerini yerine getirebilmektedir. Bu nedenle sermaye bu alana büyük ilgi göstermektedir ve bazı lider şirketlerin değerlemeleri hızla artmaktadır.”

Ancak gerçek anlamda büyük ölçekli endüstriyel uygulamalar henüz gerçekleşmedi.

Tesla, 2025 yılında yaklaşık 5.000 Optimus üretme hedefini açıklamıştı. Ancak 2025 dördüncü çeyrek finansal raporunun açıklanmasında Elon Musk, Optimus'un fabrikada yalnızca temel görevleri yerine getirdiğini ve henüz gerçek bir üretkenliğe ulaşmadığını kabul etti. Tesla'nın üçüncü nesil insan benzeri robotunun ortaya çıkışı yıl ortasında bekleniyor ve resmi üretim 2026 yılının Temmuz-Ağustos aylarında başlayacak.

Robotlar, özellikle insansı robotlar, gerçek hayatta yaygın beklentilerle büyük bir fark gösteriyor, bu da mevcut durum.

Gao Ting'e göre, önümüzdeki 2-3 yıl içinde insan benzeri robotların tamamen büyük ölçekli ticarileştirilmesi zor olacak. "Bu insan benzeri robotlar, fabrikalarda, depolama ve otomotiv üretiminde gibi nispeten sabit ortamlarda tekrarlayan ve düşük karmaşıklıktaki işleri yapmaya devam edebilir. Ancak bu uygulamalar daha çok deneme ve küçük ölçekli dağıtım şeklinde olacak, tamamen işgücünü yerine geçirmeyecek. Buna karşılık, endüstriyel robotlar, depo robotları, hizmet robotları ve bazı belirli görevler için çok amaçlı robotlar gibi ürünlerin ticarileştirme yolları daha net. Çünkü bu ürünlerin görev sınırları daha belirgin, girdi-çıktı hesaplaması daha kolay ve güvenlik ile süreçlerin kontrolü daha kolay."

Robot satın almak isteyen işletmeler için önerisi şudur: “Birinci olarak, başlangıç noktası ‘bir insan benzeri robot satın almak’ değil, yüksek değerli ve düşük karmaşıklıklı görevler bulmaktır. İkinci olarak, robotu sadece bir donanım satın alımı olarak değil, bir operasyon iyileştirme projesi olarak görmelisiniz. Gövdeyi satın almak doğrudan uygulamaya koymak anlamına gelmez; saha süreçlerini, mekân düzenlemesini, IT/OT entegrasyonunu ve çalışan iş birliğini de dikkate almalısınız. Üçüncü olarak, önce pilot uygulama yapın, ardından genişletin; bir veya iki küçük kapalı senaryodan başlayın, gerçek verimlilik sonuçlarını elde ettikten sonra kopyalayın. Dördüncü olarak, önce AMR, robot kolları ve iş birliği robotları gibi olgun kategorileri düşünün, ardından insan benzeri robotların olgunluğunu uzun vadeli olarak takip edin.”

Yüksek Teng, “Endüstride, mevcut vücutlu akıl gelişim aşamasının büyük modellerin erken dönemine benzetildiğini sıklıkla görürüz: teknik yönler giderek netleşiyor, ancak ölçeklenebilirlik henüz sağlanamadı.” Bu benzetmenin bir miktar doğru olduğunu açıklıyor, ancak robotların endüstriyelleştirilmesi daha zor. “Çünkü bu, sadece veri ve hesaplama gücüyle sınırlı kalmıyor, aynı zamanda sensörler, sürücü sistemleri, güç yönetimi ve sistem güvenilirliğiyle de ilgili.”

VLA hâlâ önemli bir rottur, dünya modelleri robot sistemlerine hızla entegre ediliyor.

Bir robotun ne yapabileceğini ve ne yapamayacağını temel olarak robot modeli, yani robotun “zihni” belirler.

High Ting, "VLA, genel robot modelleri için şu anda oldukça olgun bir teknoloji yoludur." VLA, Vision-Language-Action, yani görsel, dil ve eylem anlamına gelir. Buradaki "Dil" kısmı, büyük dil modellerinden gelir. Bu, robotların çevre bilgilerini ve görev talimatlarını birleştirerek uygun eylemler üretmesini sağlar.

Dil modellerinin rolü, robotlara anlamsal anlama, ortak bilgi ve görev planlama yetenekleri sağlamaktır. Örneğin, kullanıcı “Oda çok karanlık” dediğinde, robotun bu ifadenin ardındaki görev hedefini anlaması ve ışığı açıp açmaması gerektiğini belirlemesi gerekir.

Önceki paradigmadan farklı olarak, VLA modelleri önce genelleme yeteneğine sahip olur, ardından tek tek senaryolarda güvenilirliği artırır. Mantık tamamen tersine dönmüştür. "Eski yöntemde, önce belirli senaryolar için yüksek güvenilirlik sorunu çözülür, ardından genelleme denenirdi. Örneğin, bir robotun belirli bir hareketi çok yüksek bir güvenilirlikle yapmasını sağlayıp, sonra başka görevleri öğrenmeye çalışırdınız. Ancak bu yöntemin gerçek genelleme sağlamada zor olduğunu göreceksiniz; sadece çok özel bir robot elde edersiniz, görev değiştirince iyi yapamaz."

Yeni bir teknoloji yolculuğu olan dünya modelleri hakkında Gao Ting, “Bu, sistemin fiziksel dünyadaki durum değişikliklerini ve neden-sonuç ilişkilerini öğrenmesini ve eylemlerin olası sonuçlarını tahmin etmesini sağlayan başka bir yaklaşım sunar. Dilin bir ara katman olarak kullanılmasına gerek duymaz; fiziksel kuralların modellenmesine daha çok ağırlık verir. Deneyimli bir sürücü, önündeki bir su birikintisini gördüğünde, beyninde ‘Burada su var, kayabilir, hızımı azaltmalıyım’ gibi bir dil çevirisi yapmaz; görsel algı doğrudan aracın yörüngesi üzerine fiziksel bir tahmine yol açar ve sürücü dürtüsel olarak fren yapar. Dünya modelleri, önce dile çevirmeden doğrudan karar verme yeteneğini çözme amacındadır.”

Ancak, ona göre: “Bugün, genel amaçlı robotlar ve insan benzeri robotların öncü yaklaşımları hâlâ VLA’ya dayanmaktadır. Dünya modelleri hızlı bir şekilde gelişmektedir, ancak şu anda daha çok sentetik veri üretimi, simülasyon, değerlendirme ve yardımcı planlama için kullanılmaktadır; gerçek fiziksel robot kontrolüne doğrudan uygulanan örnekler hâlâ erken aşamadadır. Gelecek bir veya iki yıl içinde, VLA muhtemelen robot hareket modellerinin ana bileşeni olmaya devam edecektir, ancak dünya modelleri yavaş yavaş VLA sistemlerine entegre olacak ve robotlara daha güçlü fiziksel anlama, planlama ve simülasyon yetenekleri sağlayacaktır. Uzun vadede, dünya modellerinin VLA’yı basitçe yerine geçmesi değil, VLA ile dünya modellerinin birleşmesi daha olasıdır.”

High Ting, şu anda VLA'nın, mühendislik açısından uygulamaya yakın olan genel robot teknoloji yollarından biri olduğunu belirtti. İnsanlar gibi esnek ve genel akıllı olma konusunda hâlâ büyük bir fark bulunsa da, depolama ve üretimi gibi sınırları nispeten net olan senaryolarda iyi bir pratik değer göstermiştir. Gelecek dönemde, VLA muhtemelen robot endüstrileştirmesinin ana yolu olmaya devam edecektir.

Sürekli ihtiyaç duyulan “Zeki El”: Robotların seri üretimindeki çoklu mühendislik dengelemeleri

Eğer model robotun “beyni” ise, esnek eli en önemli “aletidir.” “Nesneleri işlemeye ihtiyaç duyan robotlar için uç eyleyici kritiktir; genel operasyon senaryolarında esnek el özellikle önemlidir.”

Gao Ting, herhangi bir robotik elin “hızlı el” olarak adlandırılabilmesi için yeterli serbestlik derecesine sahip olmalı, ince işlemler yapabilmeli ve farklı nesnelerin tutulmasına uyum sağlayabilmelidir dedi.

Geçtiğimiz yıllarda, esnek elde önemli ilerlemeler kaydedildi: serbestlik dereceleri arttı ve fiyatlar düştü. Ancak Gao Ting, “Esnek elin zorluğu sadece serbestlik derecesini artırmak değildir. Endüstriyel uygulamalar için daha da önemli olan, sınırlı bir alanda tutma hassasiyeti, kuvvet çıktısı, dayanıklılık ve bakım maliyetini dengede tutmaktır. En yüksek serbestlik derecesine sahip ürünler mutlaka büyük ölçekli üretmeye en uygun olmayabilir; farklı görevler, performans ve güvenilirlik arasında farklı dengelemeler gerektirir.”

Şu örneği veriyor: "Bazı yurt dışı yüksek端灵巧手, yoğun sensör yığını ve karmaşık tendon sürücü sistemi sayesinde serbestlik derecesi ve uyumlu tutma yeteneği açısından insan eline yakın olabilir, ancak genellikle fiyatı yüksektir, sıklıkla on binlerce veya hatta yüz binlerce yuan civarındadır ve büyük ölçekli dağıtım zordur. Bazı binlerce yuan seviyesindeki veya açık kaynak giriş seviyesi ürünler kullanım engelini düşürmüştür, ancak uç kuvvet çıkışı, dayanıklılık ve algılama doğruluğu gibi alanlarda hâlâ daha fazla doğrulanmaya ihtiyaç vardır ve şu anda insan gücüyle doğrudan değiştirilemez."

Veri boşluğu: Simülasyon ile gerçeklik, makine ile insan arasındaki fark

Bugün robot endüstrisi hala birçok zorlukla karşı karşıya, temel engellerden biri kaliteli veri eksikliği. “Veri, robotların ölçeklenebilirliğe ulaşmasının ilk engelidir.”

Gao Ting, büyük dil modellerinin eğitimi için kullanılan verilerin internetten nispeten kolay elde edilebilir olduğunu belirtti; ancak uzaktan kumanda verileri gibi robotların gerçek işlemlerini eğitmek için önemli maliyetler ödenmesi gerekiyor.

Gerçek veriler elde edilmesi zor olduğunda, simülasyon verileriyle değiştirilebilir mi? Bu, ikinci zorluk olan simülasyon ile gerçeklik arasındaki boşluğa ulaşır. Gao Ting, NVIDIA'nın, robotları sanal ortamlarda eğitmek, test etmek ve doğrulamak suretiyle eğitim veri setini genişletmek ve gerçek dünya deneme-yanılma maliyetlerini azaltmak için simülasyon ve sentetik veri araç zincirine odaklandığını belirtiyor. Avantajları düşük maliyet ve kolay ölçeklenebilirliktir. Ancak önemli bir sorun var: simüle edilmiş senaryolar ile gerçek dünya arasında her zaman farklar vardır. “Simülasyon ne kadar iyi yapılırsa yapılsın, gerçek dünya ile farklar kalır. Robot, sanal bir motor içinde binlerce kez mükemmel hareket eşlemeleri tamamlasa bile, gerçek dünyada küçük sürtünme kuvvetleri, malzeme veya ışık-shade değişiklikleriyle karşılaştığında, sanal ortamda öğrenilen kontrol stratejileri başarısız olabilir. Bu nedenle simülasyon verileri çok faydalıdır, ancak şu anda gerçek verileri tamamen yerine geçiremez.”

Bazıları şunu öne sürdü: Robotları, internet üzerindeki devasa miktardaki videolarla doğrudan eğitebilir miyiz? Maliyet düşük ve veriler kolayca elde edilebilir, ancak bu durumda yeni bir zorluk ortaya çıkar: Embodiment Gap (Gövde Aralığı). Basitçe ifade edersek, insan vücudunun ve robot vücudunun şekli farklıdır; bu da “gözler öğrense de, ellerin öğrenememesi” gibi bir duruma neden olur. Bu nedenle, insan davranışları videolarını veya hareket verilerini doğrudan robotlara aktarmak, verimliliği büyük ölçüde etkiler.

“Daha gerçekçi bir yol, yalnızca simülasyona dayanmak değil,” diye konuştu Gao Ting. “Gerçek robot etkileşim verilerini, uzaktan kumanda, insan tarafından öğretim ve saha geri bildirimlerini içeren bir karışık veri stratejisi kurmak; hareket yakalama, birinci şahıs videoları gibi insan davranış verileri ile simülasyon / sentetik verileri birleştirmek, robot modellerinin genelleştirme yeteneğini ve güvenilirliğini artırmak için.”

Verilerin dışında, maliyet robot endüstrisinin hâlâ karşı karşıya kaldığı zorluklardan biridir. “Robotların binlerce sektörde kullanılabilmesi için yeterince ucuz olmalı.” Ancak Gao Ting, Çin’in tedarik zincirinin büyük bir avantaj olduğunu da belirtiyor. “Unitree Technologies’in en ucuz insan benzeri robotu R1 Air’in fiyatı zaten 30.000 Çin yuanının altına düşürüldü. Bu robot henüz gerçek bir fabrikada çalışamıyor ve ana olarak bilimsel araştırmalarda kullanılıyor, ancak Çin’in robot tedarik zinciri avantajı açıkça ortada.”

Fiyatlar düşüşte, tedarik zinciri olgunlaşırken, VLA paradigmaları uygulanabilirlik gösteriyor ve sermaye akıyor. Ancak veri boşluğu, donanım sınırlamaları ve maliyet sorunları, yaygınlaşmanın yolunda hâlâ üç yüksek duvar gibi duruyor.

Bu endüstri için en rasyonel tutum, “insan benzeri” gürültüsünü takip etmek değil, şu basit soruya dönmektir: Bu makine, insanlara hangi gerçek sorunları çözmekte yardımcı olabilir? Yüksek’in de söylediğine göre: “İnsana ne kadar benzediğine takılmayın.” Bundan daha önemli olan, “kullanışlı” olmaktır. Ve fiyattan daha önemli olan, değerdir. Üretim gücüne, biçim değil, odaklanan bu endüstri yarışı henüz başlamıştır.