Gemini Omni مقابل Seedance 2.0: من هو ملك نموذج الفيديو الحقيقي؟

المؤلف: فريق محتوى تشانغآن آي بايتاي

عرضت Google في المؤتمر قدرات Gemini Omni، التي تستطيع توليد فيديوهات من مدخلات نصية وصور وصوت وفيديو، كما يمكنها تعديل الفيديوهات عبر المحادثة. وأفادت الشركة أنها ستستبدل Veo في تطبيق Gemini، وتدعم إنشاء فيديوهات مدتها 10 ثوانٍ، وتوليد صوت أصلي، وتوليد فيديو من صورة مرجعية، وتحرير فيديو إلى فيديو.

قبل ذلك، كان من الصعب تجنب Seedance 2.0 في دوائر المبدعين عند إنشاء مقاطع فيديو بالذكاء الاصطناعي، حيث تتمثل ميزاته بوضوح في الاستقرار الحركي، وإحساس الكاميرا القوي، وتوليد الصوت والصورة معًا، وجودة النتيجة النهائية للمقاطع القصيرة.

إذًا السؤال هو:

ما الفرق بين Gemini Omni وSeedance 2.0؟ من الأفضل للمُنشئين؟ تقارن هذه المقالة من ثلاث زوايا عملية: تكلفة السعر، تجربة المنتج، وجودة الفيديو.

أولاً: مقارنة الأسعار: التكلفة الحقيقية الباهظة في نماذج الفيديو هي "تكلفة الصور غير المستخدمة"

ابدأ بالسؤال الأكثر واقعية: كم تكلفتها مرة واحدة؟

هذا المقارنة بين Gemini Omni وSeedance، لا يجب النظر فقط إلى رسوم الاشتراك، بل يجب النظر إلى سؤالين:

ما تكلفة إنشاء فيديو واحد؟
كم مرة يجب إعادة المحاولة لصنع فيديو يعمل؟

1. Gemini Omni: أكثر شبهاً بنموذج "الاشتراك + رصيد التدفق"

يستخدم Gemini Omni طريقة Google AI Membership + Flow Credits.

وفقًا لحسابات AI Ultra الفائقة، فإن 25,000 رصيد شهريًا تسمح بإنشاء حوالي 8,333 ثانية من الفيديو. من هذا المنظور، فإن هيكل أسعار Gemini واضح: كلما ارتفع المستوى، انخفضت تكلفة الثانية بشكل أكثر وضوحًا.

تكلفة AI Plus حوالي 0.82 يوان/ثانية، وهي ليست منخفضة جدًا؛ لكن عند الانتقال إلى AI Pro، تنخفض التكلفة إلى 0.41 يوان/ثانية. أما في خطة Ultra، فإذا تم استخدام الحصة الشهرية بالكامل، يمكن خفض التكلفة لكل ثانية إلى حوالي 0.2 يوان/ثانية.

لذلك فإن Gemini Omni أكثر ملاءمة لفئتين:

المستخدمون الذين يستخدمون بالفعل Google AI Pro / Ultra يمتلكون قدرات الفيديو كأنهم دخلوا مباشرةً نظام الاشتراك الخاص بهم
منشئو الفيديوهات عالية التردد، لأن زيادة الكمية المولدة تقلل من التكلفة المتوسطة.

⚠️لكن يجب أيضًا الانتباه هنا: هذه التكلفة محسوبة بناءً على الأسعار في منطقة الولايات المتحدة. بالنسبة للمستخدمين الصينيين، يجب أخذ منطقة الحساب وطريقة الدفع والاستقرار في الوصول في الاعتبار.

Seedance 2.0

2. Seedance: وفقًا للسعر الأصلي للعضوية السنوية لـ Ji Meng، يستهلك 10 ثوانٍ 140 نقطة

يستخدم Ji Meng نظام العضوية والنقاط: يتم منح العضويات نقاطًا شهريًا، وتُخصم النقاط عند إنشاء الفيديو بناءً على النموذج والمدة والوضوح.

باستخدام مستوى المكافآت المتقدم، يمكن توليد حوالي 440 ثانية من الفيديو شهريًا بـ 6160 نقطة.

من هذا المنظور، فإن تكلفة Seedance مستقرة تقريبًا عند 1 يوان/ثانية. العضوية الأساسية حوالي 1.06 يوان/ثانية، والعضوية القياسية حوالي 1.00 يوان/ثانية، والعضوية المتقدمة حوالي 0.98 يوان/ثانية.

على عكس Gemini، فإن الفرق في التكلفة لكل ثانية بين مستويات Seedance ليس كبيرًا. على الرغم من أن الأعضاء المميزين أرخص، إلا أن الميزة الرئيسية ليست انخفاضًا كبيرًا في التكلفة لكل ثانية، بل القدرة على إنشاء مدة فيديو أكبر كل شهر.

مزاياه تميل أكثر نحو تجربة المنتج المحلية: وصول أكثر مباشرة، دفع أسهل، بيئة صينية أكثر ودية، وأكثر ملاءمة للمبدعين المحليين للبدء بسرعة.

Seedance 2.0

ثانيًا: تجربة المنتج: Gemini تشبه سير العمل، بينما Seedance تشبه أداة إبداعية

1. كفاءة الإنشاء: Gemini أسرع، بينما Seedance تتطلب وقت انتظار أطول

انظر أولاً إلى سرعة الإنشاء.

بعد الاختبار العملي، يستغرق إنشاء فيديو واحد بواسطة Gemini Omni حوالي دقيقتين، بينما يستغرق وقت الانتظار في Seedance وقتًا أطول، عادةً من 5 إلى 6 دقائق.

مزايا Gemini تكمن في سرعة التجربة والخطأ. يمكنك رؤية النتائج بشكل أسرع، كما أنه من الأسهل الحفاظ على حالة الإبداع.

مشكلة Seedance هي أن كل فترة انتظار أطول، وإذا لم يكن الناتج مرضيًا، فتُعاد توليد نسخة أخرى، مما يزيد تكلفة الوقت بسرعة.

لذلك من حيث الكفاءة، فإن Gemini أكثر ملاءمة للنماذج السريعة واختبار الإلهام، بينما Seedance أكثر ملاءمة لإنشاء الصور الرسمية بعد تحديد المشهد بوضوح.

2. الإصدار المرشح: يمكن لـ Gemini توليد عدة عناصر في مرة واحدة، أي أن الحلم يميل إلى التوليد الفردي.

يوجد خيار x1 / x2 / x3 / x4 في Gemini Omni؛ على سبيل المثال، إذا استهلك فيديو مدته 10 ثوانٍ 30 رصيدًا، فاختيار x2 سيستهلك 60 رصيدًا.

بسبب عدم اليقين الكبير في مقاطع الفيديو المولدة بالذكاء الاصطناعي، قد تختلف النتائج المُنتجة من نفس المُحفز بشكل كبير، لذا يتم إنتاج 4 إصدارات في وقت واحد، بحيث يمكن للمستخدم اختيار أفضل منها مباشرةً بدلاً من إعادة الانتظار لتكوين كل مقطع على حدة.

أما من حيث Ji Meng، فهي تميل أكثر إلى الإنشاء الفردي.

إذًا يمكن هنا التحقق على هذا النحو:

Gemini أكثر ملاءمة للسحب السريع والتصفية
AlDream أكثر ملاءمة لإنتاج فردي بعد تحديد المعلمات بوضوح.

3. مدة الفيديو: Ji Meng ما يصل إلى 15 ثانية، Gemini ما يصل إلى 10 ثوانٍ

الفرق الثالث هو مدة الفيديو.

من حيث تجربة المنتج الحالية، يمكن لـ Gemini Omni توليد فيديو بحد أقصى 10 ثوانٍ، بينما يمكن لـ Ji Meng توليد فيديو بحد أقصى 15 ثانية.

إذا كنت ترغب في إنشاء لقطة أكثر اكتمالاً، مثل شخص يدخل ويجلس، أو منتج ينتقل من لقطة بعيدة إلى لقطة مقربة، أو حركة درامية قصيرة، فقد تكون 10 ثوانٍ أحياناً غير كافية.

رغم أن 15 ثانية ليست طويلة، إلا أن الـ5 ثوانٍ الإضافية مقارنة بـ10 ثوانٍ تسمح في الفيديو بإنجاز حركة أو تغيير لقطة إضافية.

لذلك من حيث المدة:

Gemini أكثر ملاءمة للقطات القصيرة والمواد السريعة.
Seedance أكثر ملاءمة لمقاطع الفيديو الأقل اكتمالًا قليلاً.

إذا كنت تعمل على مسلسلات قصيرة أو مخططات إعلانية أو سرد عاطفي، فإن الحد الأقصى البالغ 15 ثانية من Seedance سيكون أكثر فائدة.

4. تحرير الفيديو: يمكن لـ Gemini مواصلة التعديل، بينما يشبه Seedance إعادة التوليد.

في إنشاء الفيديو، هناك مشكلة واقعية جدًا: ماذا تفعل إذا لم تكن راضيًا عن النسخة الأولى؟

إنشاء الصور لا بأس به، واستخراج صورة جديدة مرة أخرى لا يكلف كثيرًا؛ لكن الفيديو، بمجرد أن يشمل المدة، الانتظار، النقاط، والمراجعة، فإن كل إعادة تزيد التكلفة.

من منظور تجربة المنتج، تُبرز Gemini Omni قدرة "التحرير" بشكل أكبر. فهي لا تقتصر على السماح للمستخدم بإعادة كتابة المُحفّز ثم توليد محتوى جديد، بل تدمج الفيديو في سير عمل إبداعي مستمر: فتُولّد نسخة أولى، ثم تسمح للمستخدم بالبناء عليها وتعديلها، مثل ضبط المشهد، وتغيير الأسلوب، أو استبدال عناصر معينة، أو تحسين اللقطات بشكل إضافي.

مزايا Gemini تكمن في أنها تجعل إنشاء الفيديو أكثر كونه عملية "قابلة للتفاعل المستمر".

تجربة Seedance الحالية أكثر توجهًا نحو الأدوات التقليدية للإنشاء. إن قوتها تكمن في النتائج المُولَّدة نفسها، خاصةً في الصور والحركة والإحساس العام بالفيديو. لكن إذا لم تكن النسخة الأولى مرضية، فغالبًا ما تحتاج إلى إعادة ضبط الكلمات المفتاحية والصور المرجعية والمعالم، ثم إنشاء نسخة جديدة.

5. آلية المراجعة: القيود على الجانبين مختلفة الاتجاه

التدقيق أيضًا مشكلة لا يمكن تجنبها في الاستخدام الفعلي، وخلال اختباري، لاحظت أن مراكز التدقيق على الجانبين مختلفة قليلاً.

مراجعة محتوى الفيديو من قبل Gemini Omni تكون بشكل عام أكثر صرامة. أحد الجوانب البارزة هو أن بعض المحتويات قد لا تمر بالموافقة حتى لو تم تحويلها إلى نمط Q أو تبسيطها كارتونيًا. بمعنى آخر، لا يعني بالضرورة أن تغيير الأسلوب ليصبح أكثر "خيالية" أنه سيُخفف القيود تلقائيًا.

لكن المثير للاهتمام أن جيميني لا يكون صارمًا كما توقعت بالنسبة لمحتوى حقيقي معين. فطالما لا يتضمن بشكل واضح أشخاصًا حساسين أو انتهاكًا لحقوق الملكية أو محتوى مضلل أو عالي المخاطر، لا يزال يمكن إنشاء بعض الفيديوهات بأسلوب حقيقي.

تتجه مراجعة Seedance نحو مخاطر الأشخاص الحقيقيين والصور الشخصية. خاصةً عندما يتعلق الأمر بمحتوى يشمل أشخاصًا حقيقيين، ووجوه مشاهير، وصور متشابهة مع شخصيات مشهورة، وشخصيات أفلام أو مسلسلات، وشخصيات عامة، فإنها تثير القيود بسهولة أكبر. حتى إذا كان المُنشئ يهدف فقط إلى تعبير ترفيهي، فقد يتم منع المحتوى.

ثالثًا: جودة الفيديو: الفرق الحقيقي ليس في الإطار الواحد، بل في "ما يحدث بعد الحركة"

على مستوى الفيديو، تصبح المشكلة الأكثر أهمية هي: هل يمكن استخدام الفيديو المُنشأ؟

لم أجرِ اختبارات معقدة للغاية هذه المرة، بل بدأت من السيناريوهات الأكثر استخدامًا من قبل المُنشئين، وقمت بإنشاء عدة عينات عملية، تشمل مشاهد القتال بين الشخصيات، وإنشاء فيديو بناءً على صورة مرجعية، والحفاظ على اتساق الشخصيات، وغيرها من الاتجاهات.

الإحساس الأكثر وضوحًا حاليًا هو:

قدرة Gemini Omni على الفيديو قوية، لكن أسلوب تعبيرها أكثر ملاءمة للسياق الخارجي؛ بينما تكون Seedance أكثر سلاسة في أسلوب الصور والحركات البشرية وسياق الأنمي الذي يعتاده المبدعون الصينيون.

1. فهم المحتوى: جيميني أكثر مرونة، لكنه يميل إلى السياق الإنجليزي.

قمت باختبار سيناريو فيديو نموذجي:

أنشئ فيديو لشخصين يقاتلان.

يبدو هذا الاختبار بسيطًا، لكنه في الواقع مناسب جدًا لمراقبة قدرة النموذج على "الإبداع الحر".

بما أنني لم أضع قيودًا صارمة على ما يمكن للشخصية أن تقوله، ولم أحدد بوضوح لغة الحوارات، فإن Gemini Omni تصبح أكثر نشاطًا في إكمال محتوى الفيديو، وحتى توليد الحوارات والأصوات تلقائيًا.

لكن المشكلة أيضًا هنا: التحرير الحر لـ Gemini يبدو أكثر ملاءمة للسياق الخارجي.

بدون تحديد اللغة، فإن الشخصيات في الفيديو الذي يُنتِجُه تتحدث بالإنجليزية. وهذا يشير إلى أن Gemini يتبع بشكل افتراضي منطق إنتاج المحتوى الإنجليزي. إذا كنت ترغب في إنشاء مقاطع فيديو قصيرة بالصينية، أو محتوى مُعاد إنتاجه بالصينية، أو محتوى درامي في السياق الصيني، فعليك تحديد ذلك بوضوح في الأمر.

2. اتساق الدور: يمتلك Gemini القدرة على استخدام صور مرجعية، لكن قد تظل هناك انحرافات في الشخصيات

كما قمت باختبار إنشاء فيديو من الصورة المرجعية.

هذا الاختبار يركز على سؤال واحد:

بعد تقديم صورة مرجعية للشخصية، هل يمكن الحفاظ على اتساق الشخصية في الفيديو؟

النتيجة هي أن Gemini Omni يمكنه إنشاء فيديو بناءً على صورة مرجعية، لكن الشخصيات في الفيديو النهائي ستختلف عن الصورة المرجعية الأصلية ولا يمكنها الحفاظ على اتساق الشخصيات تمامًا.

سيكون هناك فروق طفيفة في تفاصيل الشخص مقارنة بالمرجع

إذا كان الهدف مجرد إنشاء فيديو جوي، أو فيديو كوميدي، أو مقطع إبداعي قصير، فإن تغييرًا طفيفًا في الشخصيات مقبول. لكن إذا كنت ترغب في إنشاء شخصية ثابتة تُستخدم كـ IP، فإن Omni غير قادر تمامًا على تحقيق ذلك.

3. استمرارية الحركة: يشبه Gemini مزيجًا من مقاطع، بينما يشبه Seedance حركة كاملة.

هناك مشكلة واضحة أخرى في فيديو القتال: حركات الشخصيات غير مترابطة.

الحركات في الفيديو المُنشأ بواسطة Gemini تبدو غير سلسة، وكأنها لقطات منفصلة مُجمعة معًا بدلاً من حركة واحدة مُصورة بشكل مستمر.

على سبيل المثال، الشخصيات تمتلك الحركات نفسها من الوضع الاستعدادي إلى الهجوم، والتجنب، والحركة، لكن الانتقالات بينها غير طبيعية، مما يجعل الفيديو يبدو وكأنه "تم تجميعه من قبل الذكاء الاصطناعي من بعض الإطارات الرئيسية" بدلاً من حركة مستمرة وحقيقية.

سيكون هذا واضحًا أكثر في المشاهد التي تتضمن قتالًا، أو ركضًا، أو قفزًا، أو دورانًا، أو تفاعلات متعددة الأشخاص. أما إذا كانت المشاهد بسيطة مثل تقدم الكاميرا ببطء، أو حركة خفيفة للشخصية، أو عرض منتج، فلن تكون المشكلة بارزة بنفس القدر.

ستكون Seedance أكثر توافقًا مع توقعات المبدعين في هذه السيناريوهات. عادةً ما تكون حركاتها ومشاهدها أكثر شبهاً بقطعة فيديو كاملة، خاصة في المشاهد الأنمي، والقتال، ومشاهد الحركة المختصرة، حيث سيكون الإيقاع العام أكثر طبيعية.

4. تحرير الفيديو: يمكن لـ Gemini تعديل الفيديوهات، وهذا أحد أكبر ميزاته.

ومع ذلك، فإن Gemini يتمتع بميزة مهمة جدًا على مستوى الفيديو: فهو يدعم التعديل بالذكاء الاصطناعي على الفيديوهات الموجودة مسبقًا.

بمعنى آخر، يمكنك رفع فيديو واقعي، ثم السماح لـ Gemini بتحرير محتوى الفيديو باستخدام الذكاء الاصطناعي. على سبيل المثال، تعديل عناصر المشهد، أو استبدال أجزاء معينة، أو تغيير الأسلوب، أو دمج الفيديو المُصوَّر واقعيًا مع محتوى مُنشأ بالذكاء الاصطناعي.

هذا يختلف عن حدود منتجات Seedance.

إذا كنت ترغب في دمج "الصور الواقعية + الصور المولدة بالذكاء الاصطناعي"، فإن الطريقة الشائعة الحالية لـ Seedance تعتمد بشكل أكبر على الانتقالات: فتُصوَّر أولاً مقطع فيديو واقعي، ثم يُولَّد مقطع فيديو بالذكاء الاصطناعي، ويتم ربطهما في المنتصف باستخدام انتقالات تحريرية.

رابعًا، في الختام: Seedance تُنشئ بشكل أفضل، بينما Omni أشبه بمُحرر فيديو

بعد المقارنة، أكبر انطباع هو أن تركيز Seedance و Gemini Omni مختلف.

Seedance أشبه بأداة ناضجة لإنشاء الفيديوهات بالذكاء الاصطناعي، وقوتها الأساسية هي تحويل النص أو الصور إلى فيديو.

في السيناريوهين الأكثر شيوعًا، وهو توليد الفيديو من النص وتوليد الفيديو من الصورة، لا يزال Seedance أكثر استقرارًا، حيث تكون لقطاته أقرب إلى ذوق المبدعين الصينيين، والحركات أكثر سلاسة، كما أن المشاهد مثل الأنمي والقتال والفيديوهات القصيرة أسهل في إنتاج محتوى جيد.

إذا كان طلبك هو تحويل الـ prompt إلى فيديو أو تحويل صورة واحدة إلى مشهد متحرك، فإن Seedance هو أفضل خيار حاليًا.

لكن ميزة Omni الرئيسية هي دعمها لتعديل الفيديوهات الموجودة باستخدام الذكاء الاصطناعي.

هذا يعني أن المستخدمين لا يحتاجون بالضرورة إلى البدء من مُحفّز فارغ، بل يمكنهم البناء على المواد الحالية من خلال تغيير الخلفية، أو تعديل الأسلوب، أو استبدال العناصر، وحتى دمج المحتوى المصوّر الحقيقي مع الصور المولدة بالذكاء الاصطناعي.

إذا كنت تريد إنشاء فيديو، فإن Seedance الآن أقوى.
إذا كنت ترغب في تحرير الفيديو، فإن اتجاه Omni يمتلك إمكانات أكبر.

المرحلة التالية لمقاطع الفيديو المدعومة بالذكاء الاصطناعي قد لا تكون مجرد "إنشاء مقطع فيديو"، بل جعل الفيديو قابلاً للتعديل مباشرة من قبل الذكاء الاصطناعي كما هو الحال مع الصور.

من هذا المنظور، تمثل Seedance قدرات توليد أكثر نضجًا في الوقت الحالي، بينما يشبه Omni استكشاف سير عمل تحرير الفيديو في المستقبل.