Seedance 2.0 এবং GPT 2.0 ব্যবহার করে একটি ভাইরাল শর্ট ড্রামা তৈরি করার উপায়

লেখক: চাংঅ্যান আই বাইটাই কনটেন্ট টিম

একজন যিনি কখনও ভিডিও কাটা করেননি, তিনি কি একটি গল্প, ডায়ালগ এবং ক্যামেরা শট পরিবর্তন সহ একটি এআই শর্ট ভিডিও তৈরি করতে পারেন?

হ্যাঁ, এবং পুরো প্রক্রিয়াটি অর্ধদিনের বেশি সময় নেয় না।

এই নিবন্ধটি আপনাকে শেখায়: একটি গল্প ভাবা → স্কিট বা সিন এ ভাগ করা → ভিডিও তৈরি করা → সম্পাদনা করে চূড়ান্ত ভিডিও তৈরি করা।

কোনো বেসিক জ্ঞান প্রয়োজন হবে না, একবার অনুসরণ করুন, আপনি একটি সম্পূর্ণ AI শর্ট ভিডিও পাবেন।

এক, ধারণা থেকে গল্পে: এআই ভিডিও শুধু একটি প্রম্পট দিয়ে তৈরি হয় না

অনেকেই এআই ভিডিও তৈরির প্রথম পদক্ষেপ হিসেবে জিমেং খুলে ইনপুট বক্সের দিকে তাকিয়ে থাকেন, কী লিখবেন বুঝতে পারছেন না। কয়েকটি শব্দ টাইপ করলে উত্পাদিত ফলাফল আপনার কল্পনার চেয়ে অনেক দূরে থাকে, এবং তখন আপনি সন্দেহ করতে শুরু করেন যে কি টুলটি ভালো কাজ করছে না, নাকি আপনি প্রম্পট লিখতে পারছেন না।

যেমন আমি একটি বাইটাই ছোট বোনের পুনর্জন্ম নিয়ে একটি গল্প লিখতে চাই যে ক্রিপ্টো স্পেসে একজন বড় হয়ে উঠেছে, এটি একটি ধারণা, কোনো গল্প নয়।

একটি ধারণা হল একটি দিকনির্দেশ, যা আপনাকে প্রায় কী করতে হবে তা বলে। একটি গল্প হল একটি কাঠামো, যা আপনাকে প্রতিটি দৃশ্যে কী শুট করতে হবে তা বলে। ধারণা থেকে গল্পের মধ্যে একটি কাজ রয়েছে, এই কাজটিই হল স্ক্রিপ্ট প্ল্যানিং।

সবচেয়ে সহজ উপায় হলো যেকোনো LLM খুলে আপনার মাথায় থাকা অস্পষ্ট ধারণাটি সরাসরি এটিকে বলুন, যাতে এটি আপনার গল্পকে প্রসারিত করতে সাহায্য করে। আপনাকে সব বিস্তারিত নিজে বুঝতে হবে না, আপনাকে শুধু একটি দিক দিতে হবে, বাকিটা এটির সাথে একসাথে উদ্ভাবন করতে পারেন।

গল্পের প্রবাহ নির্ধারিত হওয়ার পর, সরাসরি শট বিভাজন করবেন না, বরং বর্ণনামূলক গতি অনুযায়ী এটিকে কয়েকটি বড় অংশে ভাগ করুন, যেখানে প্রতিটি অংশের মূল বিষয়টি স্পষ্টভাবে চিহ্নিত করা হবে। এই ধাপটি সমগ্র গতি নিয়ন্ত্রণের জন্য, যাতে কোনো অংশ খুব দীর্ঘ বা খুব দ্রুত না হয়।

জেডমেনের একটি ভিডিওর সর্বোচ্চ দৈর্ঘ্য ১৫ সেকেন্ড, বাস্তবে ১২ সেকেন্ডের নিচে সবচেয়ে স্থিতিশীল এবং চিত্রের সমস্যার সম্ভাবনা সবচেয়ে কম। ১ মিনিটের প্রোডাকশনের জন্য, প্রতিটি সেগমেন্টকে গড়ে ১০ সেকেন্ড ধরে, প্রায় ৫টি সেগমেন্ট প্রয়োজন।

আমরা আমাদের গল্পকে পাঁচটি অংশে ভাগ করেছি:

প্যারাগ্রাফ এক: শুরু, মূল কাজ হল পরিস্থিতি এবং চরিত্রগুলি উপস্থাপন করা।
প্যারাগ্রাফ দুই: সময়রেখা পরিষ্কার করা হলো।
প্যারাগ্রাফ তিন: চরিত্রের ভুল বোঝাবুঝি থেকে সচেতনতার পরিবর্তন দেখান।
ধন গণনা করুন এবং আবেগকে শীর্ষে নিয়ে যান।
প্যারাগ্রাফ ৫: রিভার্স সম্পন্ন করুন, যা শুরুর সাথে বন্ধ হয়।

Seedance 2.0

প্যারাগ্রাফ নির্ধারণের পর, প্রতিটি প্যারাগ্রাফকে নির্দিষ্ট শট বর্ণনায় বিভক্ত করুন। প্রতিটি শটে চারটি উপাদান লিখুন: দৃশ্যের মূল বিষয়, অবস্থান, কী করছে, শটের কোণ। শটে গতি বর্ণনা করবেন না, শুধু স্থির মুহূর্তের বর্ণনা দিন।

প্যারাগ্রাফ ওয়ানের স্ক্রিপ্টটি এআই চ্যাটবক্সে কপি করুন, প্রবেশ করুন "আমাকে সিনেরিও ওয়ানের স্ক্রিপ্ট অনুযায়ী শট ডিসক্রিপশন জেনারেট করতে সাহায্য করুন", ফলাফলটি নিম্নরূপ👇

Seedance 2.0

দ্বিতীয়, গল্প থেকে চিত্রে: প্রথমে চরিত্র, দৃশ্য এবং স্কেটচ নির্ধারণ করুন

এই অধ্যায়টি সম্পূর্ণ প্রক্রিয়ার সবচেয়ে গুরুত্বপূর্ণ অধ্যায়, এখানে আপনি যে ছবিগুলি তৈরি করবেন, তার গুণমান সরাসরি চূড়ান্ত ভিডিওর গুণমানের সীমা নির্ধারণ করবে।

প্রথমে তিনটি দৃশ্য তৈরি করুন, আপনার প্রধান চরিত্রকে লক করুন

যেকোনো স্কিচ তৈরির আগে, প্রথম বিষয় হল মুখ্য চরিত্রের তিনটি দৃশ্য তৈরি করা।

তিনটি দৃশ্য হল একই চরিত্রের সামনের, পাশের এবং পিছনের তিনটি চিত্র, যার উদ্দেশ্য হল চরিত্রটির বাহ্যিক আকৃতি স্থির করা, যাতে পরবর্তীতে যেকোনো পরিদৃশ্য তৈরি করা হলেও চরিত্রটির সামঞ্জস্যতা বজায় রাখার জন্য এই তিনটি চিত্রকে রেফারেন্স হিসাবে ব্যবহার করা যায়।

এই ধাপটি এড়িয়ে সরাসরি স্কিচ জেনারেট করলে, আপনি দেখবেন যে প্রতিবার জেনারেট হওয়া চরিত্রগুলির চেহারা ভিন্ন হয়, চুলের স্টাইল বদলায়, মুখের আকৃতি বদলায়, এবং এই ভিডিওটি সম্পূর্ণভাবে চালিয়ে যাওয়া অসম্ভব হয়ে পড়ে।

ChatGPT/Seedream খুলুন, চ্যাট বক্সে লিখুন:

বাইটাই ছোট বোনের তিনটি দৃশ্য তৈরি করুন

একটি চিত্র তৈরি করা হবে, যাতে একই ব্যক্তির তিনটি কোণ থাকবে। যদি উত্পাদিত চিত্রটি আপনার প্রত্যাশিত চিত্রের থেকে বেশি ভিন্ন হয়, তাহলে একটি রেফারেন্স ছবি আপলোড করুন।

তিনটি দৃশ্য সন্তুষ্ট হলে, এই ছবিটি ডাউনলোড করুন, পরবর্তী প্রতিটি ভিডিও তৈরির সময় এটিকে রেফারেন্স হিসাবে আবার আপলোড করুন।

Seedance 2.0

আবার স্কেন রেফারেন্স ইমেজ তৈরি করুন, আপনার ব্যাকগ্রাউন্ড লক করুন

চরিত্র নির্ধারণের পর, একই যুক্তি অনুসরণ করে, আপনার দৃশ্যটিও আলাদাভাবে একটি রেফারেন্স ছবি তৈরি করুন, চ্যাটবক্সে টাইপ করুন: "আমাকে একটি অফিসের ছবি তৈরি করে দিন"

Seedance 2.0

ফ্রেম তৈরি শুরু করার আগে, একটি মৌলিক ধারণা বুঝতে হবে: লেন্স হল ভিডিওর সবচেয়ে ছোট প্রকাশ একক।

ক্যামেরা কথা বলে, বিভিন্ন ক্যামেরা শট পরিসর ভিন্ন ভিন্ন তথ্য প্রেরণ করে, সাধারণ শট পরিসরগুলি নিম্নরূপ:

প্যানোরামিক শট: এটি তথ্য প্রদান করে, দর্শকরা প্যানোরামিক শটের মাধ্যমে এই দৃশ্যটি কোথায় এবং কোন চরিত্রগুলি রয়েছে তা জানতে পারে।
মধ্য দৃশ্য: গল্প এগিয়ে নেওয়ার জন্য ব্যবহৃত হয়, যেখানে ক্রিয়াকলাপ এবং মুখের অভিব্যক্তি স্পষ্টভাবে দেখা যায়, এটি বর্ণনামূলকভাবে সবচেয়ে বেশি ব্যবহৃত দৃশ্য।
ক্লোজ-আপ: আবেগ তৈরি করার জন্য, শুধুমাত্র মুখ, হাত বা কোনো গুরুত্বপূর্ণ প্রোপ শুট করুন, বিস্তারিত বড় করুন, দর্শকদের প্রবল আবেগিক প্রভাব দিন।

একটি শট বুঝার পরে, আরও এক ধাপ উপরে যাওয়া দরকার: একটি ভিডিও শুধুমাত্র একটি শট নয়, বরং এটি কিছু শটের রিদমের সাথে সংযোজন।

বাস্তব প্রয়োগে, আমরা সাধারণত একটি ভিডিওর শট কাঠামো সংগঠিত করতে «চার-গ্রিড» এবং «নয়-গ্রিড» ব্যবহার করি—অর্থাৎ, একটি ভিডিওতে 4 বা 9টি শট ব্যবহার করে একটি সম্পূর্ণ প্রকাশ করা।

চারটি বক্স এবং নয়টি বক্সের পছন্দ, মূলত গতি নিয়ন্ত্রণের বিষয়:

ধীর গতির দৃশ্য: যেমন শুরুতে পরিবেশ প্রস্তুত করা বা শেষে আবেগ সমাপ্ত করা, চারটি গ্রিড পর্যাপ্ত—চারটি শটের মধ্যে প্রতিটি দৃশ্যের জন্য পর্যাপ্ত শ্বাসের জায়গা থাকে।
দ্রুত গতির দৃশ্য: যেমন যুদ্ধের চূড়ান্ত দৃশ্য, যেখানে উত্তেজনা তৈরি করতে ক্যামেরা শটগুলি ঘন ঘন পরিবর্তন করা হয়, এই সময় নাইন-গ্রিড ব্যবহার করে নয়টি শটকে একটি ভিডিওতে চাপিয়ে দেওয়া হয়, যা সম্পাদনার অনুভূতি সম্পূর্ণভাবে পরিবর্তন করে দেয়।

লেন্স এবং রিদম বুঝতে পারলে, আপনি বাস্তব তৈরির দিকে এগিয়ে যেতে পারেন: বিমূর্ত গল্পকে বিশেষ দৃশ্যে পরিণত করুন।

চরিত্রের তিনটি দৃশ্য এবং স্থানের রেফারেন্স ইমেজ প্রস্তুত হয়ে গেলে, পরবর্তী পদক্ষেপ হলো আগে লেখা স্কিপ্ট বর্ণনাগুলিকে একটি একটি করে ভিজুয়ালাইজড ইমেজে পরিণত করা। কারণটি খুব সহজ: AI একটি “নির্দিষ্ট ফ্রেম” প্রক্রিয়াকরণে বেশি দক্ষ, যখন “ধারাবাহিকভাবে পরিবর্তনশীল প্রক্রিয়া” নয়, এবং এটি কার্ড টানার হারও ব্যাপকভাবে কমিয়ে দেয়।

নির্দিষ্ট পদ্ধতি হল:

প্রতিটি শট জেনারেট করার জন্য, প্রথমে চরিত্রের তিনটি দৃশ্য এবং সংশ্লিষ্ট স্কেন রেফারেন্স ইমেজগুলি ChatGPT চ্যাটে আপলোড করুন, তারপর সম্প্রতি বিভাগীয় চিত্রের জেনারেশন প্রম্পট ইনপুট করুন।

আমাকে গল্পের সারাংশ এবং সিন বর্ণনা (পূর্ববর্তী AI-জেনারেটেড সিন টেক্সট সহ) ব্যবহার করে একটি চার-গ্রিড সিন আর্ট তৈরি করুন, স্কিন ইমেজ এবং চরিত্র ইমেজ সহ।

আপনি যে স্ক্রিপ্ট তথ্য প্রদান করেন, মডেল সেটিকে চারটি দৃশ্যে বিভক্ত করবে এবং চরিত্র এবং পরিবেশের সামঞ্জস্যতা বজায় রাখবে, ফলাফল নিম্নরূপ:

Seedance 2.0

💡 ছোট টিপস, টেক্সট টু ইমেজে কয়েকটি প্রায়শই দেখা যায় এমন ফাঁদ আছে, আগে থেকে জানলে অনেক প্রয়াস বাঁচবে:

একটি ব্যক্তি যে মোবাইল ফোন নিয়ে গেম খেলছে তার দৃশ্য তৈরি করতে চান, তবে AI স্বয়ংক্রিয়ভাবে ফোনের স্ক্রিনটিকে দর্শকের দিকে ঘুরিয়ে দেয়। AI-এর যুক্তি হলো “কন্টেন্টটি পড়া যাক”, যার ফলে গেম খেলাটি ছবির জন্য দূষণের কারণ হয়ে দাঁড়ায়। সঠিক পদ্ধতি হলো: “দুটি হাত দিয়ে অনুভূমিকভাবে ফোনটি ধরুন, স্ক্রিনটি ব্যক্তির মুখের দিকে, এবং ফোনের পিছনের অংশটি ক্যামেরার দিকে।”
পেশাগত শব্দগুলি এআইকে একটি পুরো পরিস্থিতি কল্পনা করতে বাধ্য করে: "নার্স" লিখলে, এআই হাসপাতালের কল্পনা করবে, "রান্নাবান্না" লিখলে, এআই রান্নাঘরের কল্পনা করবে। সঠিক পদ্ধতি হলো: আপনি যা প্রকৃতপক্ষে চান তা শুধুমাত্র বর্ণনা করুন, পেশার নাম উল্লেখ করবেন না।
টেক্সট টু ইমেজ শুধুমাত্র স্থির চিত্র তৈরি করতে পারে, "মাথা ঘুরানো" এর জন্য কোনো ভিজুয়াল অবস্থা নেই। সঠিক পদ্ধতি হলো: শুধুমাত্র এই ফ্রেমে উপস্থিত বিষয়গুলি বর্ণনা করুন।

Seedance 2.0

তিন, চিত্র থেকে ভিডিওতে: প্রম্পটে অ্যাকশন লিখুন, চিত্র পুনরায় লিখবেন না

স্ক্রিপ্টগুলি প্রস্তুত রয়েছে, এখন আমরা এগুলিকে চলচ্চিত্রে পরিণত করব।

🌟 রেজিস্টার করুন এবং স্বপ্ন দেখুন

ব্রাউজার খুলুন এবং "জিমেং এআই" সার্চ করুন, অফিসিয়াল ওয়েবসাইটে যান। ডান উপরের লগইনে ক্লিক করুন, ডাওয়েন অ্যাকাউন্ট বা মোবাইল নম্বর দিয়ে রেজিস্টার করুন, চীনের ভিতরে সরাসরি অ্যাক্সেস করা যায়।

নতুন ব্যবহারকারীরা 15 সেকেন্ডের একটি ভিডিও বিনামূল্যে তৈরি করতে পারেন, যদি আপনি সদস্যতা চান, তবে Biteye ছোট বোনও Seedance 2.0-এর সমস্ত প্ল্যাটফর্মের দামের তুলনা করেছেন, বিস্তারিত জানতে দেখুন: 《সমস্ত প্ল্যাটফর্মের মধ্যে Seedance 2.0-এর সবচেয়ে কম খরচে সাবস্ক্রিপশনের গাইড!》

🌟 ভিডিও প্রম্পট কীভাবে লিখবেন?

এটি এই ধাপের সবচেয়ে গুরুত্বপূর্ণ অংশ, এবং নতুনদের সবচেয়ে বেশি ভুল করার জায়গা।

প্রথমে সমস্ত রেফারেন্স ইমেজ আপলোড করুন, অর্থাৎ মেঘ একসাথে একাধিক রেফারেন্স ইমেজ আপলোড করতে পারে, শুধু ইমেজগুলি চ্যাট বক্সে ড্র্যাগ করুন। আপনি আগের অধ্যায়ে প্রস্তুত করা সমস্ত মেটিরিয়াল—চরিত্রের তিনটি দৃশ্য, সিন রেফারেন্স ইমেজ, চার-বক্স বা নয়-বক্স সিকোয়েন্স ডায়াগ্রাম—একসাথে সবগুলি ড্র্যাগ করুন, মেঘ এই ইমেজগুলির তথ্যগুলির সমন্বয়ে ভিডিও তৈরি করবে।

এখানে অনেক নতুন ব্যবহারকারী একটি ভুল করে, যেমন পর্দায় যা আছে তা পুনরায় বর্ণনা করে। অর্থাৎ, স্বপ্ন ইতিমধ্যেই আপনার আপলোড করা ছবিটি দেখতে পাচ্ছে, তাই আপনাকে আবার বলতে হবে না যে পর্দায় কী আছে।

চিত্রে কী কিছু চলছে, কীভাবে চলছে, ক্যামেরা নিজেই কি চলছে, এবং প্রতিটি সময়ের মধ্যে কী ঘটছে।

নিচের টেমপ্লেট অনুসারে লিখুন, প্রতিটি লাইন ভিডিওর একটি সময়কালকে সূচিত করে:

উপরের স্কিচ চিত্রগুলির ভিত্তিতে একটি ভিডিও তৈরি করুন।

[শুরুর সেকেন্ড থেকে শেষের সেকেন্ড], [দৃশ্যের ধরন], [ক্যামেরা মোশন], [চরিত্র বা বিষয়]+[নির্দিষ্ট ক্রিয়া], সাউন্ড ইফেক্ট: [শব্দের বর্ণনা]।

Seedance 2.0

🌟 শব্দ বর্ণনা হল নতুনদের সবচেয়ে বেশি উপেক্ষিত অংশ, যদি ভিডিওতে কথা থাকে, তবে শুধুমাত্র “কথা বলা” লিখলে যথেষ্ট নয়, মডেলটি একটি দৈবিক শব্দ তৈরি করবে। একাধিক ভিডিওতে চরিত্রের কণ্ঠস্বর একই রাখতে, দুটি পদ্ধতি রয়েছে:

১️⃣ প্রথম অংশের অডিওকে রেফারেন্স হিসেবে ব্যবহার করুন

প্রথম ভিডিওটি তৈরি করুন, এবং উত্পাদিত ফলাফলে সন্তুষ্ট হলে এই ভিডিওর অডিওটি আলাদাভাবে রপ্তানি করুন। পরবর্তী প্রতিটি অংশ তৈরি করার সময়, এই অডিওটি শব্দের রেফারেন্স হিসাবে আপলোড করুন, যাতে মেইনড এই স্বরের সন্ধান করে পরবর্তী অংশগুলির কণ্ঠস্বর তৈরি করে, যাতে স্বরের সামঞ্জস্যতা বজায় থাকে।

২️⃣ ফিশ অডিও ব্যবহার করে রেফারেন্স স্বর খুঁজুন

ফিশ অডিও খুলুন, চরিত্রের সাথে মানানসই স্বর খুঁজুন, শুনে দেখুন এবং একটি রেফারেন্স অডিও ডাউনলোড করুন। প্রতিটি ভিডিও জেনারেট করার সময় এই রেফারেন্স অডিওটি ব্যবহার করুন, যাতে সম্পূর্ণ ভিডিওতে সাউন্ড একসমান থাকে।

🌟 প্রতীক ব্যবহার করে এআই ভয়েস আউটপুটের টোন নিয়ন্ত্রণ করুন

একটি এআই ভয়েস মডেলের জন্য ডায়ালগ লিখুন, শুধু টেক্সট ঢুকিয়ে দেওয়া শেষ কথা নয়। একই বাক্যের জন্য, বিভিন্ন বিরামচিহ্ন ব্যবহার করলে উচ্চারণের স্বরভঙ্গি সম্পূর্ণভাবে ভিন্ন হতে পারে।

মূল যুক্তি হল: বিরাম চিহ্ন বিরতি নিয়ন্ত্রণ করে, বিরতি আবেগ নির্ধারণ করে।

…… প্রশ্ন বন্ধ করে কিন্তু শ্বাস চলতে থাকে, চিন্তা, দ্বিধা বা অসমাপ্ত কথার জন্য উপযুক্ত।

……! এটি একটি চাপের পর হঠাৎ বিস্ফোরণ।

() প্রতিটি বন্ধনীর ভিতরের কন্টেন্টের ভলিউম স্বয়ংক্রিয়ভাবে কমিয়ে দেওয়া হয়, যা মনের মধ্যে আত্মকথা এবং নিজের সাথে কথা বলার জন্য উপযুক্ত।

*কনটেন্ট* তারকাচিহ্ন দিয়ে ঘিরা শব্দগুলি আরও নিচে, আরও ধীরে এবং আরও ভারী হবে, যা গুরুত্বপূর্ণ তথ্যকে জোর দেওয়ার জন্য ব্যবহার করা হয়।

[] বন্ধনীর মধ্যে নির্দেশ লিখুন, যেমন [গভীর শ্বাস নিন], [১ সেকেন্ড থামুন], মডেল কাজটি করবে এবং বলবে না।

💡 ছোট টিপস:

এআই-এর দিক বোধ নেই, এটি প্রায়শই বাম ও ডান পার্থক্য করতে পারে না, তাই এআইকে মানুষের গতিপথ বুঝতে অতিরিক্তভাবে "স্থানীয় সম্পর্কের রেফারেন্স চিত্র" দেখাতে হয়, যেমন চিত্র-একে। একটি সহজ পদ্ধতি হল: মানুষের গতিপথ বর্ণনা করতে তীরচিহ্ন ব্যবহার করুন, এবং শেষে "তীরচিহ্নগুলি মুছে ফেলুন" যোগ করুন।
ধীরে লিখুন, দ্রুত লিখবেন না। মডেল ধীর গতির ক্রিয়াকলাপকে দ্রুত গতির ক্রিয়াকলাপের চেয়ে অনেক বেশি স্থিতিশীলভাবে প্রক্রিয়া করে। দ্রুত গতির দৃশ্যগুলির প্রয়োজন হলে, মডেলকে দ্রুত ক্রিয়াকলাপ তৈরি করতে বাধ্য করার পরিবর্তে ক্লিপের গতি বাড়ানোই প্রাধান্য দিন।
প্রতিটি ভিডিও সেগমেন্টের জন্য রেফারেন্স ছবি আপলোড করুন, শুধু একবার আপলোড করবেন না। মডেলটি সেগমেন্টের মধ্যে মেমোরি রাখে না, তাই রেফারেন্স ছবি আপলোড না করলে চরিত্রের চেহারা বিচ্যুত হয়ে যাবে।

Seedance 2.0

চতুর্থ: ফ্রেম থেকে পুরো ভিডিওতে: এডিটিং ভিডিওর চূড়ান্ত মান নির্ধারণ করে

এডিটিং এবং পোস্ট-প্রোডাকশন হল পুরো প্রক্রিয়ার সবচেয়ে গুরুত্বপূর্ণ ধাপ, যেখানে আগের প্রতিটি মেটেরিয়াল স্বতন্ত্র, রঙের পার্থক্য থাকতে পারে, গতি অসংগঠিত এবং শব্দ বিচ্ছিন্ন, এবং এডিটিংয়ের কাজ হল এই টুকরোগুলিকে একটি সম্পূর্ণ গল্পে গড়ে তোলা।

ভিডিওতে সঙ্গীত যোগ করলে দর্শকদের আবেগ আরও বেড়ে যায়, সাবটাইটেল যোগ করলে ডায়ালগ আরও স্পষ্ট হয়। একই ম্যাটেরিয়াল দিয়ে, ভালোভাবে এডিট করলে এবং খারাপভাবে এডিট করলে, চূড়ান্ত ফলাফলের মধ্যে এক মাত্রার পার্থক্য হতে পারে।

চারটি ধাপে কাজ করুন: মেটেরিয়াল সাজান → টোন একটি করুন → শব্দ যোগ করুন → সাবটাইটেল যোগ করুন, তারপর এক্সপোর্ট করুন।

প্রথম ধাপ: উপাদানগুলি সাজান

কাপিং খুলুন, সমস্ত ক্লিপগুলি দৃশ্যের ক্রম অনুযায়ী টাইমলাইনে টেনে আনুন। প্রথমে টোন এবং শব্দের বিষয়ে চিন্তা করবেন না, ক্রমটি নিশ্চিত করুন, সমগ্র গতি পরীক্ষা করুন এবং যেসব ক্লিপ খুব দীর্ঘ, সেগুলির অতিরিক্ত অংশ এই ধাপে কেটে ফেলুন।

দ্বিতীয় ধাপ: একটি সমন্বিত রং ব্যবহার করুন

ভিন্ন সময়ে তৈরি করা ক্লিপগুলির রংয়ের তাপমাত্রা এবং উজ্জ্বলতা সামান্য পার্থক্য থাকতে পারে, যা একসাথে রাখলে বিচ্ছিন্ন মনে হয়। সমাধান: সমস্ত ক্লিপগুলি সিলেক্ট করুন, এবং "রেগুলেট" এ একটি ফিল্টার যোগ করুন—প্রথম দৃশ্যের জন্য শীতল নীল টোন, দ্বিতীয় দৃশ্যের পরে উষ্ণ হলুদে পরিবর্তন করুন, যাতে প্রতিটি দৃশ্যের ভিতরে রংয়ের সামঞ্জস্যতা বজায় থাকে।

তৃতীয় ধাপ: ব্যাকগ্রাউন্ড সংগীত এবং সাউন্ড ইফেক্ট যোগ করুন

ভিডিও তৈরির সময় ডায়ালগ সাউন্ড ইতিমধ্যে প্রক্রিয়াকরণ করা হয়েছে, এই ধাপটি মূলত দুই ধরনের শব্দ যোগ করে: ব্যাকগ্রাউন্ড মিউজিক এবং পরিবেশগত সাউন্ড ইফেক্ট।

ব্যাকগ্রাউন্ড সংগীত মোট আবেগের ভিত্তি নির্ধারণ করে, এর ভলিউম ডায়ালগের 30% এর নিচে রাখুন, মানুষের কণ্ঠকে ঢাকবেন না।

চতুর্থ ধাপ: সাবটাইটেল যোগ করুন

শিম্পিং-এর "স্মার্ট সাবটাইটেল" ব্যবহার করে ডায়ালগ স্বয়ংক্রিয়ভাবে শনাক্ত করুন, তারপর ভুল বানান পরীক্ষা করুন এবং ফন্ট এবং অবস্থান এককভাবে সাজান। পরিচালকের বা নিজের সাথে কথা বলার ডায়ালগগুলির জন্য, এটি সাধারণ ডায়ালগ থেকে আলাদা করতে ইটালিক বা ভিন্ন রঙ ব্যবহার করুন।

পাঁচ: টুল থেকে প্রকাশে: এআই ভিডিও কী পরিবর্তন করেছে

গত প্রবন্ধে, "GPT Image 2.0 সহ সিড্যান্স 2.0: প্রত্যেকেই হলিউড ব্লকবাস্টার তৈরি করতে পারবেন", আমরা মনে করি যে AI যুগে: "ভিডিও তৈরি" এর বাধা কমে গেছে, ভবিষ্যতে প্রত্যেকেই হলিউড ব্লকবাস্টার তৈরি করতে পারবেন।

কিন্তু কম বাধা বলে তুমি এটি করতে পারবে এমন নয়।

সরঞ্জামগুলি সব প্রকাশ্যে উপলব্ধ, টিউটোরিয়ালগুলিও সব জায়গায় পাওয়া যায়, কিন্তু বেশিরভাগ মানুষ একই জায়গায় আটকে যায়: কখনও একবারও সম্পূর্ণভাবে চালানো হয়নি।

এই আর্টিকেলে, Biteye আপনাকে একটি অস্পষ্ট ধারণা থেকে শুরু করে একটি সম্পূর্ণ ভিডিওতে পরিণত করার প্রক্রিয়াটি ধাপে ধাপে দেখিয়েছে।

অতীতে, এই প্রক্রিয়াটি একটি সম্পূর্ণ পেশাদার বিভাগীয় বিভাজন প্রয়োজন করত: স্ক্রিপ্টরাইটার, স্টোরিবোর্ড, আর্ট, ক্যামেরা ও এডিটিং, প্রতিটি ধাপই একটি বাধা ছিল।

এবং এখন, এই ধাপগুলি অদৃশ্য হয়ে যায়নি, শুধু একটি প্রক্রিয়ায় সংকুচিত হয়েছে।

এর অর্থ একটি আরও মৌলিক পরিবর্তন: ভিডিও এখন প্রযোজনা ক্ষমতার ফলাফল নয়, বরং প্রকাশের ক্ষমতার ফলাফল হয়ে উঠছে।