Yazan: Zheng Minfang
Kaynak: Wall Street'in Gözlemcisi
OpenAI'nin, Büyük Okyanus'un öbür yakasında AI üretim modeli Sora için "durdur" butonuna bastığı sırada, Çin'in teknoloji devleri bu alanda bir karşı saldırganlık başlattı.
Yakın zamanda, Bytedance, çok modlu girdi, kendi kamera hareketlerini yönetme ve tutarlılık gibi avantajlarıyla interneti patlatan yeni AI video oluşturma modeli Seedance 2.0'ı piyasaya sürdü.
Oyun Bilimi Kurucusu Feng Ji, derin bir deneyimden sonra oldukça önemli bir değerlendirme yaptı: "İçerik alanlarında önceki hiçbir zaman görülmemiş bir enflasyonun yaşanacağından eminim."
Feng Ji'nin yordamı, karamsar bir kafadan gelen bir yordam değil.
Bu şok dalgası, e-ticaret, oyun, video platformları ve sinema yapımı gibi sektörlerde hızla hissedilmeye başlanıyor: e-ticaret alanında, düşük maliyetli dış kaynaklı işler ve çekim merkezlerinin teknik engelleri tamamen ortadan kalktı; oyun endüstrisinde, kavram doğrulama ve satın alma malzemesi üretimi döngüsü en aza indirildi ve rekabet daha da sertleşti; video platformları, arz patlamasını yönetmek için dağıtım mantıklarını daha da iyileştirmek zorunda kaldı; sinema yapımında geleneksel "çekim + montaj" doğrusal süreci, "ipucu + üretimi" olan endüstriyel boru hattı tarafından boyut düşürücü bir saldırıya uğramaktaydı.
Yararlanma ve yerine geçme konusundaki endüstriyel büyük yıkım zaten başladı.
Video üretiminin patlaması
Geçen yıl, AI videolarının en büyük problemi teslimatlıktı.
Sora, Runway, yerli olan Keling veya hatta ByteDance'in kendi geliştirdiği Jimeng dahil olmak üzere hepsinde bu tür bir sorun mevcuttur. Yaratıcılar genellikle "kart çekme" oyununa sıkışır, birkaç saniyelik bozulmadan ve tutarlı bir video elde etmek için onlarca kez tekrar üretme zorunda kalırlar.
Seedance 2.0'ın temel kırılım noktası, "gösterişli becerileri" "teslim edilebilir anlatımlara" dönüştürmeye çalışmasıdır.
Kilit becerilerdeki kırılma üç yönde belirgindir:
Birincisi çok modlu girdi. Günlük teknoloji testlerine göre, ilk kez Dream uygulamasına kaydolan abone kullanıcılar, Seedance 2.0'yi doğrudan kullanmak için sadece 1 yuan ile otomatik yinelenebilir üyeyi açabilirler. Metin, resim, video ve ses dosyaları referans materyal olarak girdiye izin verilir. Neredeyse tüm hayal edebileceğiniz formatlar videonun oluşturulması için girdi olarak kullanılabilir.
İkincisi, hikâye anlatımını anlayabilmek ve kendi başınıza kamera hareketlerini yönetebilmektir. Seedance 2.0, "yönetmen seviyesinde" düşünme yeteneğine sahiptir. Hem karmaşık anlatım mantıklarını anlayabiliyor hem de kamera dilini otomatik olarak yönlendirebiliyor, yakınlaştırma, uzaklaştırma, yatay ve dikey hareketler gibi kamera işlemleri yapabiliyor. Videolar artık sadece statik görüntülerin basit bir hareketiyle değil, sinematografik bir anlatım mantığıyla oluşturuluyor.
Üçüncüsü, görsel tutarlılıktır. 24/7 Tech'in piyasada bulunan birçok yapay zeka videolu uygulamayı test etmesine göre, konunun hareket etmesi sırasında yüz ifadelerinde bozulma ve arka planda net ve bulanık görüntülerin bir arada bulunması gibi sorunlar sürekli ortaya çıkmaktadır.
Ancak demo videosundan da görülebileceği gibi Seedance 2.0, ana vücut hareket sürecindeki yüz, sahne ve diğer bilgilerin tutarlılığını koruyarak akıcı bir hikaye anlatımını mümkün kılmaktadır.
Bu, AI videolu üretimin oyuncaklardan araçlara doğru geçtiğini anlamına gelir. Videolu üretimi standart bir sanayi boru hattı haline getiren bu yetenek, "herkes bir yönetmen olabilir" ifadesinin artık boş bir slogan olmadığını gösterir ve bu da videolu üretim maliyetlerini büyük oranda azaltacaktır.
Feng Ji, bu dönüşümü "enflasyon" ile nitelendirdi.
"Genel video üretiminin maliyeti artık sinema ve televizyon endüstrisinin geleneksel mantığına göre ilerleyemeyecek ve hesaplama kapasitesinin marjinal maliyetine yaklaşmaya başlayacak. İçerik alanlarında önceki hiçbir zaman yaşanmamış bir enflasyonun gelmesi kaçınılmazdır ve geleneksel organizasyon yapıları ve üretim süreçleri tamamen yeniden yapılandırılacaktır. Denediyseniz, bu tahminin korkusuz bir tahayyül olmadığını çok çabuk anlayacağınıza inanıyorum." Feng Ji ifade etti.
İlk darbe
Video üretiminin marjinal maliyeti sıfıra yaklaştığında, eski maliyet yapısına dayanan ticari modeller ilk etkilenen olur.
E-ticaret, oyun, video platformları ve sinema yapımı dört sektör, etkilenecek ilk sektörler olabilir.
En doğrudan sarsıntılar öncelikle e-ticaret sektöründe hissedildi.
Ürün gösterimi, sahne yorumlaması ve işlev açıklaması videoları, temelde karmaşık sanatsal anlatımlara değil, net bilgi aktarımına dayanmaktadır.
Seedance 2.0'nin yaygınlaşmasıyla birlikte, satıcıların video ifade yeteneğine erişimini sağlayan engeller tamamen ortadan kaldırıldı. Geçmişte "bilgi farkı" ve "teknoloji eşiği"ne dayanarak hayatta kalan düşük kaliteli video dış kaynaklı şirketleri ve Taobao çekim merkezleri soğuk bir kışla karşı karşıya kalacak, video üretimi profesyonel dış kaynaklı hizmetlerden satıcılara ait günlük işletmelerin yönünde kayabilir.
E-ticaret ile kıyaslandığında, oyunlara AI video üretim modellerinin etkisi belki de nispeten sınırlı kalacak, ancak devrim sessizce başlamış durumda.
Dünya görüşüne dayalı senaryolar, kavramsal doğrulama ve satın alma malzemesi videolarının maliyeti üssel olarak düşmektedir. Daha fazla proje daha erken aşamada doğrulanacak ve aynı zamanda daha erken aşamada elenecektir.
Bir Pekin oyun şirketi yetkilisi, TechCrunch'a şirketin Seedance 2.0 üzerinde küçük ölçekte testler başlattığını söyledi.
Yapay zeka videolu üretim modelleri, video platformlarının dağıtım mantıklarını da değiştiriyor.
TikTok, Kuaishou gibi platformlar için Seedance 2.0 gibi modellerin ürettiği videolar, içerik arzında patlamaya yol açmakta ve bu da platformların temel rekabet gücünün tamamen "seçim ve dağıtım" mekanizmalarına kaymasına neden olmaktadır. Örneğin, hangi algoritmanın sonsuz AI üretimi içinden altınları daha doğru şekilde çıkarabileceğini, hangi ticari dönüşüm verimliliğinin daha yüksek olduğunu belirlemektedir.
Film ve video alanında, Seedance 2.0'ın çok kamera anlatım yeteneği üretim süreçlerini yeniden şekillendirebilir.
Bir film ya da televizyon dizisinin doğuşu, geçmişte genellikle katı bir doğrusal sanayi sürecine uygundu: önce çok sayıda malzeme çekilirdi, ardından bu malzemelerden seçme ve düzenleme yapılarak anlatı mantığı, montajörlerin sonradan düzenlediği bir oda içinde inşa edilirdi.
Ancak Seedance 2.0'ın mantığı içinde bu sınır bulanıklaşıyor.
Çekim aşamasında, gelecekteki sahnelerin düşük maliyetli yapay zeka modelleriyle oluşturulabileceğini düşünmek mümkün; modeller kendi başlarına kamera hareketlerini ve anlatım tempolarini anlayabiliyorlar, videoyu üretirken aslında "kesim" işini eşzamanlı olarak bitiriyorlar.
AI artık sadece parçalı malzeme karelerini çıkarmakla kalmıyor, doğrudan tutarlı zaman-uzay ilişkilerine sahip "bitmiş filmler" teslim ediyor.
Bu, geleneksel sinema ve televizyon yapımında zaman alıcı olan son düzenleme aşamasının, algoritmalar tarafından "boyut düşürücü darbe" alma riskiyle karşı karşıya olduğunu anlamaktadır.
Geleceğin üretim akışları artık "fotograf çekimi + montaj" olmaktan ziyade "ipucu + üretimi" olabilir. Montajcıların rolleri, "operatör"den "komut mühendisine" veya "estetik denetçisine" doğru evrilecektir.
Mevcut Seedance 2.0 tarafından üretilen videoların yüzde yüz mükemmel olmaması ve mantıksal detaylar, görüntüler gibi konularda hâlâ geliştirilmesi gereken yönlerin olmasıyla birlikte, teknolojik gelişimin piyasa beklentilerini çok geride bırakan hızla ilerlediği bir ortamda, bu zorlukların yakında engel olmayacağı görülüyor.
IP'nin "Kale Dibi"
Seedance 2.0'nin inanılmaz "yeniden yaratma" yeteneği, sıradan insanlara yaratma zevkini sunarken, aynı zamanda telif hakkı sahiplerine önceki dönemlerde görülmemiş bir baskı yaratmıştır.
Son günlerde, Zhao Shichang'ın klasik filmlerinin "ikinci yaratım" hatta "alaycı" sahneleri kısa video platformlarında patladı.
AI video üretim modellerinin hesaplama gücü sayesinde, Zhao Xingzhi'nin yüz ifadeleri, karakteristik kahkahası ve klasik alıntı tarzı, birçok kullanıcı tarafından düşük maliyetle kopyalanmış ve hatta birçok asla gerçekleşmemiş absürt hikaye üretilmiştir.
Bu hızlıca Çoung Sing-tze ekibinin dikkatini çekti.
Stephen Chow'un temsilcisi Chan Chun Yiu, kamuoyuna açıkça şu mesajı verdi: "Sormak isterim, bunlar telif hakkı ihlalleri midir (özellikle bu iki gün içinde büyük ölçüde yayılanlar)? Yaratıcıların zaten kar elde ettiğine inanıyorum, belirli bir platform bu durumu kullanıcıların üretimi ve yayımı için kullanıcıların üretimi ve yayımı için izin vermekten kaçınmıyor mu?"
Bu itiraz, AI çağındaki telif hakkı kaygısını açığa vuruyor gibi görünse de, ticari mantığın derinliklerinden bakıldığında, AI çağındaki en üst düzey IP'lerin (tanınmış isimlerin) ne kadar çok kıymetli olduğunu gösteriyor.
Yarın, aşırı AI üretimi içeren bu akışta teknoloji kendisi artık bir engel olmaktan çıkıyor çünkü herkes aynı Seedance 2.0 araçlarına sahip.
Gerçek engeller hâlâ IP sahiplerinin elinde.
Piyasada çok sayıda "yüksek kaliteli taklit" Çou Xinghe olduğu için, "Gerçek Çou Xinghe" markasının yerine geçilemezliği daha da belirginleşiyor.
İçerik arzı sadece fazlalıktan ziyade "enflasyon" yaşarken, kullanıcıların zamanı ve dikkatleri şimdiye kadar görülmediği kadar değerli hale geldi. Kullanıcıların dikkatini anında çekebilecek olanlar, yine zaman içinde test edilmiş ve güçlü duygusal penetrasyon gücüne sahip klasik IP'lerdir.
Bunu başka şekilde ifade edersek, yapay zeka üretimin barajlarını düşürse de, "tanınırlık"ın değerini sınırsız olarak yükseltti.
IP sahipleri için gelecek hâlâ umut verici. Yıllar süren IP varlıkları artık sadece fikri mülkiyet ihlallerinin hedefi olmaktan çıkmış olacak ve doğrudan lisanslama yoluyla sayısız yaratıcının elinden geçerek, yapay zekânın kaldıracı altında ticari değerin üssel büyümesini sağlayacak.
2024 Şubat'ında OpenAI tarafından sunulan Sora 1.0, 60 saniyelik AI videoları üretebilme özelliğine sahip ilk model olarak dünya çapında dikkat çekti. Bugüne kadar, 2 yılda ByteDance Seedance 2.0, 60 saniyelik yerli sesli anlatı filmlerini üretebilen çok modallı girdiye sahip hale geldi.
Teknoloji bu kadar hızlı gelişen bir çağda, her sektörün kendi kavga etmesi gereken bir kavşakta olduğu görülüyor: Uygulama maliyetleri sonsuz derecede azaltılıyor, yinelenen, işgücü ve süre yığılarak yapılan işler acımasızca değiştiriliyor; aynı zamanda, IP ve yaratıcılık değerleri sonsuz derecede büyüyor.
Araçlar elde kolayca bulunabilir hale geldiğinde, içeriklerin kalitesini belirleyen artık yazılım kullanabilme konusundaki bilgi ya da beceri değil, zihindeki dünya görüşünün yeterince özgün olup olmayacağı olacaktır.
