Sır dolu AI video modeli HappyHorse, kör test sıralamalarında Seedance 2.0'ı geçti

Bir basın toplantısı yok, bir teknik blog yok, hiçbir şirketin desteği yok—HappyHorse-1.0 adlı bir metinden videoya modeli, resmi AI değerlendirme platformu Artificial Analysis'ın AI Video Arena sıralamasında, Seedance 2.0'ı daha yüksek bir Elo puanıyla geçerek Keling, Tian Gong gibi diğer ana akım oyuncuları arkada bırakarak teknoloji dünyasında bir “şifre çözme yarışı” yarattı.

Artificial Analysis sıralaması teknik parametre testleri değil, gerçek kullanıcıların gözlem sonuçlarından elde edilen Elo puanlarını yansıtan bir sıralamadır ve bu da sıradan bir kullanıcının izledikten sonra gerçek algısını gösterir. Bu sıralama, genel performans listelerinden daha az eleştiriye açık hale getirir ve “Bu şey aslında kimin yaptığı?” sorusu, göz ardı edilemez bir hale gelir.

“Mutlu At” sessizce zirveye ulaşıyor ve teknoloji dünyasında bir bulmaca yarışması başlatıyor

X'te tahminler hızlı geldi. İlk dikkat çeken, resmi web sitesinin dil sıralamasıydı: Mandarince ve Kantonca İngilizce'den önce geliyordu. Küresel kullanıcılar için bir ürün olan bu sıralama biraz tuhafdı—eğer ABD ekibi öncülük ediyorsa, İngilizce neredeyse asla birinci olmazdı. Arkadaki ekip Çin'den gelmektedir, bu doğrultuda kesinlikle doğrulanabilir.

Sand.ai

İsim kendisi de bir ipucudur. 2026, Çin takvimine göre At Yılıdır; “HappyHorse” adı, pek de ince olmayan bir at yılı oyunu saklar; bu yılın başlarında “Pony Alpha” da benzer bir taktik kullandı. Bu nedenle şüpheli listesi hızla uzadı: Tencent ve Alibaba’nın kurucuları her ikisi de “Ma” soyadına sahip, doğal olarak listede yer alıyor; bazıları Xiaomi’yi destekliyor, Lei Jun’un genellikle sakin olması ve aniden kartını açmayı sevmesi nedeniyle; diğerleri ise DeepSeek’e daha uygun bir hava olduğunu düşünüyor, çünkü DS daha önce gizlice bir görsel modeli yayınlamış, ardından yine gizlice kaldırmıştı. Tüm tahminler yoğun bir şekilde dolaşıyor, ancak hiçbiri kesin bir kanıt sunamıyor.

Gerçek hedef, teknik düzeydeki adım adım karşılaştırmadır. X kullanıcısı Vigo Zhao, HappyHorse-1.0'un açık temel verilerini bilinen modellerle tek tek karşılaştırdı ve yüksek uyumlu bir nesne buldu: daVinci-MagiHuman, yani Mart'ta Github'a açılan açık kaynak modeli "Leonardo Magic Human".

Sand.ai

Görsel kalite 4,80, metin hizalaması 4,18, fiziksel tutarlılık 4,52, sesli metin hata oranı %14,60 — iki veri seti her bir kriterde tamamen örtüşüyor. Web sitesi yapısı da neredeyse aynı: mimari açıklaması, performans tabloları ve demo videolarının sunum tarzı, aynı şablondan türemiş gibi görünüyor. İkisi de tek akışlı Transformer mimarisi, ses ve video birlikte üretimi destekliyor ve desteklenen diller listesi tamamen aynı. Bu düzeydeki örtüşme, rastlantı ile açıklanamaz.

Şu anda teknoloji topluluğunda en çok kabul gören sonuç, HappyHorse'un daVinci-MagiHuman'ın ortak geliştiricilerinden biri olan Sand.ai tarafından, açık kaynak modeli temel alarak optimize edilmiş bir sürüm olduğudur; temel amacı, modelin kullanıcı gerçek tercihleri altındaki performans sınırını test etmek ve sonraki ticari uygulamalar için temel oluşturmaktır.

Sand.ai

daVinci-MagiHuman, 23 Mart 2026'da resmen açık kaynak hale geldi ve iki genç ekibin ortak çalışmasının ürünüdür. Birisi, akademisyen Liu Pengfei'nin liderliğinde Şangay Yaratıcı Zeka Akademisi'nden (SII) Geleneksel Yapay Zeka Araştırma Laboratuvarı (GAIR); diğeri ise, akademik arka plana sahip kurucusu Cao Yue'nin başlattığı ve otoregresif dünya modeli üzerine odaklanan Pekin'deki Sand.ai (San Dai Teknoloji)'dir.

15 milyar parametreli, saf dikkat mekanizmasına dayalı tek akışlı Transformer modeli kullanılır; metin, video ve ses modallarının tüm token'ları aynı dizide birlikte modellenir—açık kaynak topluluğunda daha önce hiç kimse gerçek bir ses-video birleşik ön-eğitim yapmamıştı; çoğu durumda tek modallı modeller üzerine eklemeler yapılmıştı.

İki haftada nasıl tersine döndü? Açık kaynaklı bir video modeli

Kimlik belirlendikten sonra, başka bir soru daha zor cevaplanır: daVinci-MagiHuman Mart sonunda açık kaynak hale geldi, HappyHorse-1.0 neden sadece iki hafta içinde Seedance 2.0'dan daha yüksek bir Elo puanı elde edebildi?

Resmi web sitesindeki bilgilere göre, HappyHorse alt yapıda herhangi bir değişiklik yapmamıştır; en mantıklı tahmin, değerlendirme senaryolarına özel olarak varsayılan üretim stratejisini ayarlamış olmasıdır.

Elo sistemi temelde kullanıcı tercihlerinin birikimidir; karakter ifadelerinin kararlılığı, ses ile görüntü arasındaki uyum ve görsel estetik gibi algısal hassas noktalarda biraz daha iyi performans göstermek, kör testlerde seçilme şansını artırır. Modelin kapasitesi sınırı değişmemiş olsa da, “değerlendirme performansı” geliştirilebilir.

Aslında, Artificial Analysis'ın gözlemlenmemiş örneklerinde, insan portreleri ve sesli içeriklerin oranı %60'ı aşmaktadır. daVinci-MagiHuman, eğitim aşamasından itibaren insan portrelerine odaklanmıştır ve bu tür senaryolarda doğal olarak bir avantaja sahiptir; bu da onun gözlemlenmemiş testlerdeki üstünlüğünün temel nedenidir; gözlemlenmemiş örnekler insan portreleri yakın çekimlerden oluşuyorsa, insan portrelerine uzman olan modeller sistematik olarak avantajlı olur, ancak bu, çoklu karakterler, karmaşık kamera hareketleri ve uzun süreli hikâye anlatımı gibi karmaşık senaryolardaki gerçek performansıyla doğrudan ilişkili değildir.

Sand.ai

Sonuç olarak, sıralamadaki sayılar ile gerçek deneyim arasında açık bir fark ortaya çıktı ve Twitter'daki tartışmacılar iki gruba ayrıldı. Şüpheciler, testlerin ardından HappyHorse-1.0 ile Seedance 2.0 arasında karakter detaylarında ve dinamik tutarlılığında görülebilir farklar olduğunu belirterek Elo puanlamasının temsiliyetini sorguladı.

Destekçiler, HappyHorse'un endüstrideki bir kritik sorunu çözecek potansiyele sahip olduğunu umuyor; bu sorun, mevcut ana akım video modellerinin hâlâ çözemediği "çoklu kamera serilerindeki görsel tutarlılık" sorunu. Eğer daVinci-MagiHuman gerçekten burada bir atılım yaparsa, bu bir sıralama pozisyonundan çok daha önemli olabilir.

Sand.ai

Modelin kendi sınırlamaları sayılarla gizlenmemelidir. Xiaohongshu blog yazarı @JACK, daVinci-MagiHuman’ı hemen dağıttı ve test etti. Bu modelin H100 gerektirdiğini fark etti, standart tüketici düzeyi grafik kartları için neredeyse imkânsız. Topluluk, kuantizasyon çözümleri üzerinde çalışıyor olsa da, kısa vadeli olarak bireysel kullanıcıların yerel olarak dağıtım yapması hâlâ zor.

Sahne üzerinde şu anda chủ yếu tek bir kişiye odaklanır; birden fazla kişi görüntüye girer ya da sahne karmaşıklaşırsa kalite düşer—bu, ayarlamalarla çözülemeyen bir sorundur ve yüz portrelerine odaklanan tasarım yönelimiyle doğrudan ilgilidir. Oluşturma süresi genellikle yaklaşık 10 saniyedir; daha uzun olursa karışır, yüksek çözünürlüklü çıktılar için üst çözünürlük eklentilerine ihtiyaç duyulur.

@JACK'in AI görüşüne göre, daVinci-MagiHuman'in genel kullanım kolaylığı LTX 2.3'ten daha düşük; kantitatif analizler topluluk tarafından tamamlanana kadar günlük kullanım için uygun değildir.

Video üretimi yarışması, gerçek “kalkan balığı” mı bekliyor?

Elbette, bir liderlik pozisyonu çok şey ifade etmez. Şimdi HappyHorse, kararlılık, yüksek eşzamanlı erişim hızı, çapraz senaryo tutarlılığı, rol kontrol doğruluğu ve değerlendirme setlerinin dışındaki genelleştirme kapasitesi gibi konularda daha kapsamlı bir teste tabi tutulmalıdır. Bunlar, bir modelin gerçekten yaratıcı iş akışına girebilmesini belirleyen temel göstergelerdir.

Ancak daha geniş endüstri yapısına bakıldığında, bu olayın ilettiği sinyal aslında yeterince net.

Açık kaynaklı video modeli kendisi yeni bir şey değildir. Ancak açık kaynak ile kapalı kaynak arasında her zaman duran, etki düzeyindeki görünür bir farktır—müşterilere teslim edilmesi gereken senaryolarda, açık kaynak modellerinin üretimi uzun süredir “kullanılabilir”den “teslim edilebilir”e geçememiştir. Keling, Seedance gibi kapalı kaynaklı ürünlerin fiyat belirleme gücü, büyük ölçüde bu fark üzerine kuruludur.

Bu kez, açık kaynaklı bir ürünün, gerçek kullanıcı algısına dayalı gizli değerlendirme sıralamasında, mevcut ana akım kapalı kaynak rakipleriyle ilk kez doğrudan yarıştığını gösteriyor. Değerlendirme senaryosuna yönelik yapılan optimize edilmeler ne kadar olursa olsun, bu farka dayanarak fiyatlandırma gücü oluşturan kapalı kaynak üreticiler için en azından ciddiye alınması gereken bir sinyaldir.

Geliştiriciler için bu dönüm noktası daha spesifik bir anlam taşır. Portre, dijital insan, sanal yayıcı gibi dikey senaryolarda, açık kaynak temel tabanının üretim kalitesi “teslim edilebilir” eşiğine ulaştığında, kendi kendine dağıtım maliyet yapısı temel olarak değişecektir—sadece API çağrısı maliyetlerinin azalması değil, aynı zamanda verileri, modelleri ve çıkarım zincirini tamamen kendi kontrol altına alarak, kapalı kaynak çözümlerinin sağlayamadığı özelleştirme derinliği ve gizlilik uyumluluğu açısından esneklik kazanılmasıdır.

HappyHorse-1.0, Seedance 2.0 veya Keling'in pazar konumunu kısa sürede sarsmayacaktır; ancak açık kaynak modellerin kapalı kaynak modellerle eşit performans gösterdiği algısı yerleştiğinde, quantitatif optimizasyon, dikey ince ayar ve çıkarım hızlandırma, kapalı kaynak ürünlerin çok daha hızlı bir şekilde devam eden topluluk çabalarıyla ilerleyecektir.

Bu At Yılında, belki de en çok dikkat edilmesi gereken, hangi atın en hızlı koşması değil, pistin genişlemesi.

Bu yazı, WeChat hesabından "AI Değer Sorumlusu" tarafından yayınlanmıştır, yazar: Xingye, editör: Meiqi