كيفية إنشاء مسلسل قصير فيروسي باستخدام Seedance 2.0 و GPT 2.0

icon MarsBit
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
دورة تعليمية جديدة حول الذكاء الاصطناعي وأخبار العملات المشفرة تُظهر كيفية إنشاء مسلسل قصير كامل مُولَّد بالذكاء الاصطناعي باستخدام Seedance 2.0 وGPT 2.0. تغطي الدليل توليد الأفكار، وتخطيط السيناريو، وتقسيم المشاهد، وإنشاء الصور والفيديوهات، والتحرير النهائي. وتُبرز الحاجة إلى هيكل قصة قوي، وثبات الشخصيات، وتعليمات دقيقة. كما تُقدَّم نصائح للحفاظ على توافق العناصر البصرية والصوتية عبر أجزاء الفيديو. المقال جزء من أحدث أخبار العملات المشفرة حول أدوات الذكاء الاصطناعي لإنشاء المحتوى.

المؤلف: فريق محتوى تشانغآن آي بايتاي

هل يمكن لشخص لم يقم بقص فيديو من قبل أن يُنتج مقطع فيديو قصيرًا بالذكاء الاصطناعي يحتوي على قصة وحوار وتحولات كاميرا؟

نعم، وجميع الخطوات لا تستغرق أكثر من نصف يوم.

هذه المقالة تعلمك كيفية الانتقال من: التفكير في قصة → تقسيمها إلى لقطات → إنشاء فيديو → تحريره إلى فيلم نهائي.

لا تحتاج إلى أي خبرة سابقة، فقط اتبع الخطوات مرة واحدة، وستحصل على فيديو قصير بالذكاء الاصطناعي كامل.

أولاً: من الفكرة إلى القصة: فيديو الذكاء الاصطناعي لا يُنشأ بجملة واحدة من التوجيه

يبدأ الكثير من الناس في إنشاء مقاطع فيديو بالذكاء الاصطناعي بفتح Ji Meng والجلوس أمام مربع الإدخال، غير مدركين ما يجب كتابته. بعد كتابة بضع كلمات، ينتج المحتوى شيئًا مختلفًا تمامًا عما تخيلوه، فيبدأون في الشك فيما إذا كان الأداة غير فعالة أم أنهم لا يعرفون كيفية كتابة التعليمات.

على سبيل المثال، "أريد أن أصنع قصة عن صغيرتي Biteye التي تُولد من جديد في عالم العملات الرقمية لتُصبح كبيرة" — هذا فكرة، وليس قصة.

الفكرة هي اتجاه، وهي تخبرك بما يجب فعله تقريبًا. القصة هي هيكل، وهي تخبرك بما يجب تصويره في كل مشهد. بين الفكرة والقصة، هناك عمل يجب القيام به، وهذا العمل هو تخطيط السيناريو.

أسهل طريقة هي فتح أي نموذج لغوي كبير، وقول فكرتك الغامضة مباشرةً له، وتركه يساعدك في تطوير القصة. لا تحتاج إلى توضيح جميع التفاصيل بنفسك؛ ما عليك سوى تقديم اتجاه، ويمكنك بعد ذلك استنتاج الباقي معه.

بعد تحديد السرد، لا تقسم المشاهد مباشرة، بل قسّمه أولاً إلى عدة أقسام كبيرة وفقًا لإيقاع السرد، وحدد بوضوح ما هي القضية الأساسية في كل قسم. هذه الخطوة تهدف إلى التحكم في الإيقاع العام ومنع أي قسم من أن يكون بطيئًا جدًا أو مُسرعًا جدًا.

أطول مقطع في Ji Meng هو 15 ثانية، وفي الممارسة العملية، فإن المقاطع الأقصر من 12 ثانية هي الأكثر استقرارًا وأقل احتمالًا لحدوث مشاكل في الصورة. للفيديو النهائي الذي مدته دقيقة واحدة، وبافتراض أن كل مقطع يبلغ متوسطه 10 ثوانٍ، ستحتاج إلى حوالي 5 مقاطع.

نقطع قصتنا إلى خمسة فقرات:

  • الفقرة الأولى: الافتتاح، المهمة الأساسية هي توضيح السيناريو والشخصيات.

  • الفقرة الثانية: السفر عبر الزمن، المهمة الأساسية هي توضيح الخط الزمني.

  • الفقرة الثالثة: إظهار تحول الشخصية من الحيرة إلى الوضوح.

  • احسب ثروتك، وارفع المشاعر إلى ذروتها.

  • الفقرة الخامسة: أكمل التحول، واغلق الحلقة مع المقدمة.

Seedance 2.0

بعد تحديد الفقرات، قسّم كل فقرة إلى وصفات مشهد محددة. اكتب أربعة عناصر لكل مشهد: الموضوع الرئيسي للصورة، الموقع، ما الذي يفعله، زاوية التصوير. لا تكتب حركة في لوحات المشهد، بل صف اللحظة الثابتة فقط.

انسخ نص الفقرة الأولى في مربع الدردشة الخاص بالذكاء الاصطناعي، وأدخل "ساعدني في إنشاء وصف لمشاهد بناءً على نص الفقرة الأولى"، وسيكون التأثير كما يلي👇

Seedance 2.0

ثانيًا: من القصة إلى الصورة: حدد أولًا الشخصيات والمشاهد واللقطات

هذه الفقرة هي الأهم في العملية بأكملها، حيث تحدد جودة الصور التي تُنشئها هنا الحد الأقصى لجودة الفيديو النهائي.

قم أولاً بعمل الرؤوس الثلاثة، ثم ثبت بطلتك

قبل إنشاء أي لقطات، أول شيء هو إعداد الرؤية الثلاثية للشخصية الرئيسية.

الرسم الثلاثي هو ثلاث صور لنفس الشخصية من الأمام والجانب والخلف، وهدفه تثبيت مظهر الشخص، بحيث يمكن الرجوع إلى هذه الصور الثلاث عند إنشاء أي مشهد لاحق للحفاظ على اتساق الشخصية.

إذا تخطيت هذه الخطوة وقمت مباشرة بإنشاء لوحات المشهد، فستجد أن الشخصية التي تُنشَأ في كل مرة تختلف في المظهر—يتغير تسريحة الشعر، وشكل الوجه—وسيصبح من المستحيل إكمال هذا الفيديو.

افتح ChatGPT/Seedream، وأدخل في مربع الحوار:

ساعدني في إنشاء رسم ثلاثي الأبعاد لـ Biteye Small Sister

سيقوم الذكاء الاصطناعي بإنشاء صورة تحتوي على نفس الشخص من زوايا ثلاث، وإذا كان الشخص الناتج يختلف كثيرًا عما تريده، يمكنك رفع صورة مرجعية.

بعد أن تكون راضيًا عن الرؤية الثلاثية، قم بتنزيل هذه الصورة، وقم بتحميلها مرة أخرى كمرجع في كل مرة تولد فيها فيديو.

Seedance 2.0

قم بإنشاء صورة مرجعية للسيناريو، وثبّت خلفيتك

بعد تحديد الدور، استخدم نفس المنطق لإنشاء صورة مرجعية منفصلة للسيناريو، وأدخل في مربع الحوار: "ساعدني في إنشاء صورة لمكتب"

Seedance 2.0

قبل البدء في إنشاء لوحات المشهد رسميًا، يجب فهم مفهوم أساسي: اللقطة هي أصغر وحدة تعبيرية في الفيديو.

الكاميرا أيضًا تتحدث، وكل نوع من زوايا التصوير ينقل معلومات مختلفة، ومن بين أنواع الزوايا الشائعة ما يلي:

  • اللقطة الواسعة: تقدم المعلومات، حيث يفهم المشاهد من خلال اللقطة الواسعة أين تقع المشهد وما هي الشخصيات الموجودة.

  • المنظر المتوسط: يستخدم لدفع القصة للأمام، ويُظهر الحركات والتعبيرات بوضوح، وهو أكثر أنواع اللقطات استخدامًا في السرد.

  • لقطة مقرّبة: تصوير الوجه أو اليد أو أداة رئيسية واحدة فقط، مع تكبير التفاصيل لخلق تأثير عاطفي قوي للمشاهد.

بعد فهم لقطة واحدة، يجب الانتقال إلى مستوى أعلى: الفيديو ليس لقطة واحدة، بل هو نتيجة دمج عدة لقطات معًا وفقًا لإيقاع معين.

في التصنيع الفعلي، نستخدم عادةً "الشبكة الرباعية" و"الشبكة التساعية" لتنظيم هيكل لقطات الفيديو — أي ترتيب 4 أو 9 لقطات في فيديو واحد لإتمام التعبير الكامل.

اختيار الشبكة الأربعية أو التساعية هو في جوهره التحكم في الإيقاع:

  • الأقسام ذات الإيقاع البطيء: مثل المقدمة التي تُحدد البيئة أو الخاتمة التي تُختم المشاعر، يكفي استخدام شبكة أربعة خانات؛ فالأربع لقطات توفر مساحة كافية لكل صورة للتنفس.

  • المقاطع السريعة: مثل ذروة المشاهد القتالية، حيث تحتاج الكاميرات إلى التبديل بسرعة لخلق إحساس بالتوتر، وفي هذه الحالة، استخدام شبكة التسعة خانات، حيث يتم ضغط تسعة لقطات في مقطع فيديو واحد، يعطي شعورًا مختلفًا تمامًا عند التحرير.

بعد فهم الكاميرا والإيقاع، يمكن البدء في الإنتاج الفعلي: تحويل القصة المجردة إلى صور ملموسة.

بعد إعداد رسومات المنظور الثلاثي للشخصية وصور المرجع للخلفية، الخطوة التالية هي تحويل وصف المشاهد المكتوب مسبقًا إلى صور مرئية واحدة تلو الأخرى. السبب بسيط: فالذكاء الاصطناعي أكثر كفاءة في التعامل مع "إطارات منفردة محددة" مقارنة بـ"العمليات المتغيرة المستمرة"، كما أنه يقلل بشكل كبير من معدل العشوائية.

الطريقة المحددة هي:

قم بإنشاء لقطة واحدة في كل مرة، وقم بتحميل صور العرض الثلاثي للشخصية وصور المرجع الخاصة بالمشهد في محادثة ChatGPT، ثم أدخل نص التحفيز الذي تم إنشاؤه للقطات السابقة.

ساعدني في إنشاء صورة مكونة من أربعة أقسام بناءً على ملخص القصة + وصف المشاهد (مع إدراج كلمات المشاهد التي تم إنشاؤها مسبقًا بواسطة الذكاء الاصطناعي)، مع إرفاق صورة المشهد + صورة الشخصيات

سيقوم النموذج بتفكيك هذا المشهد إلى أربع لقطات بناءً على معلومات المشهد التي قدمتها، مع ضمان اتساق الشخصيات والمشهد، كما هو موضح:

Seedance 2.0

💡 نصائح صغيرة، هناك عدة أخطاء شائعة في توليد الصور من النص، ومعرفتها مسبقًا يمكن أن توفر لك العديد من المحاولات:

  1. لإنشاء لقطة لشخص يحمل هاتفًا ويُلعب لعبة، سيتحول شاشة الهاتف تلقائيًا نحو المشاهد. منطق الذكاء الاصطناعي هو جعل "المحتوى قابلًا للقراءة"، مما يجعل اللعب مصدر تلوث للصورة. الطريقة الصحيحة هي: "الاحتفاظ بالهاتف أفقيًا باليدين، مع توجيه الشاشة نحو وجه الشخص، واتجاه ظهر الهاتف نحو الكاميرا".

  2. المصطلحات المهنية تجعل الذكاء الاصطناعي يربط سيناريو كامل: عند كتابة "ممرضة"، سيربط الذكاء الاصطناعي المستشفى، وعند كتابة "طاهٍ"، سيربط الذكاء الاصطناعي المطبخ. الطريقة الصحيحة هي: وصف الملابس التي تريدها حقًا فقط، دون ذكر أسماء المهن.

  3. يُمكن للنص إلى صورة إنشاء صور ثابتة فقط، ولا توجد حالة بصرية مُقابلة لـ "الدوران بالرأس". الطريقة الصحيحة هي: وصف العناصر الموجودة في هذه الإطار فقط.

Seedance 2.0

ثالثًا: من الصورة إلى الفيديو: اكتب التعليمات بأسلوب الحركة، ولا تعيد صياغة المشهد

تم إعداد جميع لوحات المشهد، والآن نحن نحولها إلى فيديو متحرك.

🌟 سجّل الآن واحلم

افتح المتصفح وابحث عن "Ji Meng AI"، ثم انتقل إلى الموقع الرسمي. انقر على تسجيل الدخول في الزاوية العلوية اليمنى، ويمكنك التسجيل باستخدام حساب Douyin أو رقم الهاتف، ويمكن الوصول إليه مباشرة داخل الصين.

يمكن للمستخدمين الجدد إنشاء فيديو مدته 15 ثانية مجانًا، وإذا كنت بحاجة إلى عضوية افتتاحية، فقد قارنت Biteye Xiao Shimei أسعار Seedance 2.0 عبر منصات متعددة على الإنترنت، التفاصيل متاحة في: >>> دليل الاشتراك بأقل تكلفة عالمية لـ Seedance 2.0!

🌟 كيف تكتب تعليمات الفيديو؟

هذا هو الجزء الأكثر أهمية في هذه الخطوة، وأيضًا المكان الذي يخطئ فيه المبتدئون أكثر.

أولاً، قم بتحميل جميع صور المرجع في نفس الوقت، حيث يدعم Ji Meng رفع عدة صور مرجعية في وقت واحد؛ ما عليك سوى سحب الصور مباشرة إلى مربع الدردشة. قم بسحب جميع المواد التي أعددتها في الفصل السابق — صور الزاوية الثلاثية للشخصية، صور المرجع للخلفية، أو صور التقسيم بتنسيق 4 أو 9 خانات — دفعة واحدة، وسيقوم Ji Meng بدمج معلومات هذه الصور لإنشاء الفيديو.

هناك خطأ شائع يرتكبه العديد من المبتدئين، وهو إعادة وصف ما هو موجود في الصورة. أي أن الحلم يمكنه بالفعل رؤية الصورة التي قمت بتحميلها، ولا حاجة لأن تخبره بما هو موجود في الصورة.

يجب أن يحتوي مُحفّز الصورة على: ما الذي يتحرك في المشهد، وكيف يتحرك، وما إذا كان العدسة نفسها تتحرك، وما يحدث خلال كل فترة زمنية.

وفقًا للقالب التالي، كل سطر يتوافق مع فترة زمنية في الفيديو:

ساعدني في استخدام مخطط اللقطات أعلاه لإنشاء فيديو.

[الثانية الابتدائية إلى الثانية النهائية]، [إطار المشهد]، [طريقة التصوير]، [الشخصية أو العنصر الرئيسي] + [الحركة المحددة]، المؤثرات الصوتية: [وصف الصوت].

Seedance 2.0

🌟 وصف الصوت هو الجزء الذي يتجاهله المبتدئون بسهولة؛ إذا كان هناك حوار في الفيديو، فكتابة "صوت الحديث" فقط غير كافية، حيث سيولد النموذج صوتًا عشوائيًا كمرجع. لضمان اتساق صوت الشخصية عبر مقاطع فيديو متعددة، هناك طريقتان:

1️⃣ استخدم الصوت من الفقرة الأولى كمرجع

قم أولاً بإنشاء الجزء الأول من الفيديو، وبعد أن ترضى عن النتيجة، صدر الصوت فقط من هذا الفيديو. في كل جزء لاحق تُنشئه، قم بتحميل هذا الصوت كمرجع صوتي، بحيث سيستخدم夢 هذا النبرة لإنشاء الأصوات في الأجزاء التالية، مما يضمن اتساق الصوت.

2️⃣ ابحث عن صوت مرجعي باستخدام Fish Audio

افتح Fish Audio، وابحث عن صوت يتوافق مع شخصية الدور، واستمع إليه ثم حمّل مقطعًا كمرجع صوتي. استخدم هذا المرجع الصوتي بشكل موحد عند إنشاء كل مقطع فيديو للحفاظ على اتساق الصوت في الفيديو الكامل.

🌟 استخدم علامات الترقيم للتحكم في نبرة الصوت الصناعي للذكاء الاصطناعي

اكتب نصوصًا لنموذج توليد الصوت بالذكاء الاصطناعي، وليس فقط أدخل النص وانتهيت. نفس الجملة، مع تغيير علامات الترقيم، يمكن أن تُنتج نبرة مختلفة تمامًا.

المنطق الأساسي هو: علامات الترقيم تتحكم في التوقف، والتوقف يحدد المشاعر.

…… تُستخدم النقاط الثلاث لقطع الصوت مع استمرار التنفس، وهي مناسبة لحالات التفكير، التردد، أو الكلام غير المكتمل.

......! الاستخدام المجمع هو انفجار مفاجئ بعد كبت.

يتم خفض صوت المحتوى بين الأقواس تلقائيًا ليصبح همسًا، مناسبًا للحوار الداخلي والكلام مع النفس.

*الكلمات المحاطة بنجمات ستكون أقل، أبطأ، وأثقل، وتُستخدم للتأكيد على المعلومات الأساسية.*

[] اكتب الأوامر بين الأقواس المربعة، مثل [شهيق عميق]، [توقف لمدة ثانية واحدة]، وسيقوم النموذج بتنفيذ الإجراء بدلاً من نطقه.

💡نصائح صغيرة:

  1. الذكاء الاصطناعي لا يمتلك وعيًا بالاتجاهات، وغالبًا ما يصعب عليه التمييز بين اليسار واليمين، لذا يجب إعداد "رسم توضيحي للعلاقات المكانية" لإخبار الذكاء الاصطناعي بكيفية حركة الشخص، كما هو موضح في الشكل 1. هناك طريقة بسيطة أخرى: استخدام الأسهم لوصف مسار حركة الشخص، ثم إضافة "احذف الأسهم" في النهاية.

  2. اكتب ببطء، وليس بسرعة. المعالجة النموذجية للحركات البطيئة أكثر استقرارًا بكثير من الحركات السريعة. بالنسبة للمقاطع التي تتطلب إيقاعًا سريعًا، يُفضل استخدام سرعة التحرير لتحقيق ذلك، بدلاً من جعل النموذج يولد حركات سريعة.

  3. يجب رفع صورة مرجعية لكل مقطع فيديو، ولا ترفعها مرة واحدة فقط. النموذج لا يمتلك ذاكرة عبر المقاطع، ولن تُحافظ على مظهر الشخصية في المقاطع التي لا تُرفع فيها صورة مرجعية.

Seedance 2.0

رابعًا: من المشهد إلى الفيديو الكامل: التحرير يحدد جودة الفيديو النهائية

التحرير والمعالجة اللاحقة هما الخطوة التي تُكمل العمل، حيث تكون كل قطعة من المواد التي تم إنشاؤها مسبقًا منفصلة، وقد تختلف ألوانها، ولا تكون الإيقاعات متصلة، والصوت موزع، ودور التحرير هو دمج هذه القطع المبعثرة لتكوين قصة متماسكة.

إضافة الموسيقى إلى الفيديو تزيد من تأثيره العاطفي على المشاهدين، وإضافة الترجمة تجعل الحوار أكثر وضوحًا. نفس المواد، عند التحرير الجيد مقابل التحرير السيء، يمكن أن تختلف في الجودة النهائية بمقدار مستوى كامل.

تتم العملية على أربع خطوات: ترتيب المواد → توحيد الألوان → إضافة الصوت → إضافة الترجمة، ثم التصدير.

الخطوة الأولى: ترتيب المواد

افتح CapCut واسحب جميع المقاطع على خط الزمن بالترتيب المشهدي. لا تهتم باللون أو الصوت في هذه المرحلة، فقط تأكد من الترتيب وراجع الإيقاع ككل، واقطع الأجزاء الزائدة من المقاطع الطويلة في هذه الخطوة.

الخطوة الثانية: توحيد الألوان

قد تختلف درجة اللون والسطوع قليلاً بين المقاطع المُنشأة في أوقات مختلفة، مما يجعلها تبدو منفصلة عند عرضها معًا. الطريقة المعالجة: حدد جميع المقاطع بالكامل، وأضف مرشحًا واحدًا على مستوى الكل في قسم "الضبط"، استخدم درجة لون زرقاء باردة للمشهد الأول، ثم انتقل إلى درجة لون صفراء دافئة للمشاهد التالية، كافِ فقط للحفاظ على اتساق الألوان داخل كل مشهد.

الخطوة الثالثة: أضف موسيقى خلفية ومؤثرات صوتية

تم معالجة الصوت الحواري بالفعل أثناء إنشاء الفيديو، وهذه الخطوة تركز على إضافة نوعين من الأصوات: الموسيقى الخلفية ومؤثرات البيئة.

يحدد الموسيقى الخلفية النبرة العاطفية العامة، ويجب خفض الصوت إلى أقل من 30% من صوت الحوار، ولا يجب أن تطغى على الصوت البشري.

الخطوة الرابعة: إضافة الترجمات

استخدم ميزة "العناوين الذكية" في JianYing لتحديد الحوار تلقائيًا، ثم راجع الأخطاء الإملائية ووحد الخط والموقع. يُقترح تمييز الحوارات التي هي تعليقات صوتية أو حوار داخلي بأسلوب مختلف عن الحوار العادي، مثل المائل أو لون مختلف.

خامساً: من الأداة إلى التعبير: ما الذي غيّره الفيديو المدعوم بالذكاء الاصطناعي حقًا

في المقال السابق "GPT Image 2.0 يعزز Seedance 2.0: الجميع يمكنه تصوير أفلام هوليوود"، اعتبرنا أن في عصر الذكاء الاصطناعي: تم خفض عتبة "تصوير الفيديوهات"، وسيتمكن الجميع في المستقبل من تصوير أفلام هوليوود.

لكن انخفاض الحد الأدنى لا يعني أنك تستطيع إنجازه.

الأدوات جميعها عامة، والدروس التعليمية متاحة في كل مكان، لكن معظم الناس يعلقون في نفس المكان: لم ينفذوا أبدًا عملية كاملة من البداية إلى النهاية.

في هذه المقالة، أخذك Biteye من فكرة غامضة خطوة بخطوة حتى تحولت إلى فيديو كامل.

في الماضي، كان هذا العملية تتطلب مجموعة كاملة من التخصصات الاحترافية: سيناريست، مخطط مشاهد، فنان تشكيلي، مصور، ومونتير، وكل مرحلة كانت عقبة.

واليوم، لم تختفِ هذه الخطوات، بل تم ضغطها داخل عملية واحدة.

هذا يعني تغييرًا أكثر جوهرية: لم تعد الفيديوهات ناتجة عن "القدرة الإنتاجية"، بل بدأت تصبح ناتجة عن "القدرة التعبيرية".

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.