লেখক: চাংঅ্যান আই বাইটাই কনটেন্ট টিম
একজন যিনি কখনও ভিডিও কাটা করেননি, তিনি কি একটি গল্প, ডায়ালগ এবং ক্যামেরা শট পরিবর্তন সহ একটি এআই শর্ট ভিডিও তৈরি করতে পারেন?
হ্যাঁ, এবং পুরো প্রক্রিয়াটি অর্ধদিনের বেশি সময় নেয় না।
এই নিবন্ধটি আপনাকে শেখায়: একটি গল্প ভাবা → স্কিট বা সিন এ ভাগ করা → ভিডিও তৈরি করা → সম্পাদনা করে চূড়ান্ত ভিডিও তৈরি করা।
কোনো বেসিক জ্ঞান প্রয়োজন হবে না, একবার অনুসরণ করুন, আপনি একটি সম্পূর্ণ AI শর্ট ভিডিও পাবেন।
এক, ধারণা থেকে গল্পে: এআই ভিডিও শুধু একটি প্রম্পট দিয়ে তৈরি হয় না
অনেকেই এআই ভিডিও তৈরির প্রথম পদক্ষেপ হিসেবে জিমেং খুলে ইনপুট বক্সের দিকে তাকিয়ে থাকেন, কী লিখবেন বুঝতে পারছেন না। কয়েকটি শব্দ টাইপ করলে উত্পাদিত ফলাফল আপনার কল্পনার চেয়ে অনেক দূরে থাকে, এবং তখন আপনি সন্দেহ করতে শুরু করেন যে কি টুলটি ভালো কাজ করছে না, নাকি আপনি প্রম্পট লিখতে পারছেন না।
যেমন আমি একটি বাইটাই ছোট বোনের পুনর্জন্ম নিয়ে একটি গল্প লিখতে চাই যে ক্রিপ্টো স্পেসে একজন বড় হয়ে উঠেছে, এটি একটি ধারণা, কোনো গল্প নয়।
একটি ধারণা হল একটি দিকনির্দেশ, যা আপনাকে প্রায় কী করতে হবে তা বলে। একটি গল্প হল একটি কাঠামো, যা আপনাকে প্রতিটি দৃশ্যে কী শুট করতে হবে তা বলে। ধারণা থেকে গল্পের মধ্যে একটি কাজ রয়েছে, এই কাজটিই হল স্ক্রিপ্ট প্ল্যানিং।
সবচেয়ে সহজ উপায় হলো যেকোনো LLM খুলে আপনার মাথায় থাকা অস্পষ্ট ধারণাটি সরাসরি এটিকে বলুন, যাতে এটি আপনার গল্পকে প্রসারিত করতে সাহায্য করে। আপনাকে সব বিস্তারিত নিজে বুঝতে হবে না, আপনাকে শুধু একটি দিক দিতে হবে, বাকিটা এটির সাথে একসাথে উদ্ভাবন করতে পারেন।
গল্পের প্রবাহ নির্ধারিত হওয়ার পর, সরাসরি শট বিভাজন করবেন না, বরং বর্ণনামূলক গতি অনুযায়ী এটিকে কয়েকটি বড় অংশে ভাগ করুন, যেখানে প্রতিটি অংশের মূল বিষয়টি স্পষ্টভাবে চিহ্নিত করা হবে। এই ধাপটি সমগ্র গতি নিয়ন্ত্রণের জন্য, যাতে কোনো অংশ খুব দীর্ঘ বা খুব দ্রুত না হয়।
জেডমেনের একটি ভিডিওর সর্বোচ্চ দৈর্ঘ্য ১৫ সেকেন্ড, বাস্তবে ১২ সেকেন্ডের নিচে সবচেয়ে স্থিতিশীল এবং চিত্রের সমস্যার সম্ভাবনা সবচেয়ে কম। ১ মিনিটের প্রোডাকশনের জন্য, প্রতিটি সেগমেন্টকে গড়ে ১০ সেকেন্ড ধরে, প্রায় ৫টি সেগমেন্ট প্রয়োজন।
আমরা আমাদের গল্পকে পাঁচটি অংশে ভাগ করেছি:
প্যারাগ্রাফ এক: শুরু, মূল কাজ হল পরিস্থিতি এবং চরিত্রগুলি উপস্থাপন করা।
প্যারাগ্রাফ দুই: সময়রেখা পরিষ্কার করা হলো।
প্যারাগ্রাফ তিন: চরিত্রের ভুল বোঝাবুঝি থেকে সচেতনতার পরিবর্তন দেখান।
ধন গণনা করুন এবং আবেগকে শীর্ষে নিয়ে যান।
প্যারাগ্রাফ ৫: রিভার্স সম্পন্ন করুন, যা শুরুর সাথে বন্ধ হয়।

প্যারাগ্রাফ নির্ধারণের পর, প্রতিটি প্যারাগ্রাফকে নির্দিষ্ট শট বর্ণনায় বিভক্ত করুন। প্রতিটি শটে চারটি উপাদান লিখুন: দৃশ্যের মূল বিষয়, অবস্থান, কী করছে, শটের কোণ। শটে গতি বর্ণনা করবেন না, শুধু স্থির মুহূর্তের বর্ণনা দিন।
প্যারাগ্রাফ ওয়ানের স্ক্রিপ্টটি এআই চ্যাটবক্সে কপি করুন, প্রবেশ করুন "আমাকে সিনেরিও ওয়ানের স্ক্রিপ্ট অনুযায়ী শট ডিসক্রিপশন জেনারেট করতে সাহায্য করুন", ফলাফলটি নিম্নরূপ👇

দ্বিতীয়, গল্প থেকে চিত্রে: প্রথমে চরিত্র, দৃশ্য এবং স্কেটচ নির্ধারণ করুন
এই অধ্যায়টি সম্পূর্ণ প্রক্রিয়ার সবচেয়ে গুরুত্বপূর্ণ অধ্যায়, এখানে আপনি যে ছবিগুলি তৈরি করবেন, তার গুণমান সরাসরি চূড়ান্ত ভিডিওর গুণমানের সীমা নির্ধারণ করবে।
প্রথমে তিনটি দৃশ্য তৈরি করুন, আপনার প্রধান চরিত্রকে লক করুন
যেকোনো স্কিচ তৈরির আগে, প্রথম বিষয় হল মুখ্য চরিত্রের তিনটি দৃশ্য তৈরি করা।
তিনটি দৃশ্য হল একই চরিত্রের সামনের, পাশের এবং পিছনের তিনটি চিত্র, যার উদ্দেশ্য হল চরিত্রটির বাহ্যিক আকৃতি স্থির করা, যাতে পরবর্তীতে যেকোনো পরিদৃশ্য তৈরি করা হলেও চরিত্রটির সামঞ্জস্যতা বজায় রাখার জন্য এই তিনটি চিত্রকে রেফারেন্স হিসাবে ব্যবহার করা যায়।
এই ধাপটি এড়িয়ে সরাসরি স্কিচ জেনারেট করলে, আপনি দেখবেন যে প্রতিবার জেনারেট হওয়া চরিত্রগুলির চেহারা ভিন্ন হয়, চুলের স্টাইল বদলায়, মুখের আকৃতি বদলায়, এবং এই ভিডিওটি সম্পূর্ণভাবে চালিয়ে যাওয়া অসম্ভব হয়ে পড়ে।
ChatGPT/Seedream খুলুন, চ্যাট বক্সে লিখুন:
বাইটাই ছোট বোনের তিনটি দৃশ্য তৈরি করুন
একটি চিত্র তৈরি করা হবে, যাতে একই ব্যক্তির তিনটি কোণ থাকবে। যদি উত্পাদিত চিত্রটি আপনার প্রত্যাশিত চিত্রের থেকে বেশি ভিন্ন হয়, তাহলে একটি রেফারেন্স ছবি আপলোড করুন।
তিনটি দৃশ্য সন্তুষ্ট হলে, এই ছবিটি ডাউনলোড করুন, পরবর্তী প্রতিটি ভিডিও তৈরির সময় এটিকে রেফারেন্স হিসাবে আবার আপলোড করুন।

আবার স্কেন রেফারেন্স ইমেজ তৈরি করুন, আপনার ব্যাকগ্রাউন্ড লক করুন
চরিত্র নির্ধারণের পর, একই যুক্তি অনুসরণ করে, আপনার দৃশ্যটিও আলাদাভাবে একটি রেফারেন্স ছবি তৈরি করুন, চ্যাটবক্সে টাইপ করুন: "আমাকে একটি অফিসের ছবি তৈরি করে দিন"

ফ্রেম তৈরি শুরু করার আগে, একটি মৌলিক ধারণা বুঝতে হবে: লেন্স হল ভিডিওর সবচেয়ে ছোট প্রকাশ একক।
ক্যামেরা কথা বলে, বিভিন্ন ক্যামেরা শট পরিসর ভিন্ন ভিন্ন তথ্য প্রেরণ করে, সাধারণ শট পরিসরগুলি নিম্নরূপ:
প্যানোরামিক শট: এটি তথ্য প্রদান করে, দর্শকরা প্যানোরামিক শটের মাধ্যমে এই দৃশ্যটি কোথায় এবং কোন চরিত্রগুলি রয়েছে তা জানতে পারে।
মধ্য দৃশ্য: গল্প এগিয়ে নেওয়ার জন্য ব্যবহৃত হয়, যেখানে ক্রিয়াকলাপ এবং মুখের অভিব্যক্তি স্পষ্টভাবে দেখা যায়, এটি বর্ণনামূলকভাবে সবচেয়ে বেশি ব্যবহৃত দৃশ্য।
ক্লোজ-আপ: আবেগ তৈরি করার জন্য, শুধুমাত্র মুখ, হাত বা কোনো গুরুত্বপূর্ণ প্রোপ শুট করুন, বিস্তারিত বড় করুন, দর্শকদের প্রবল আবেগিক প্রভাব দিন।
একটি শট বুঝার পরে, আরও এক ধাপ উপরে যাওয়া দরকার: একটি ভিডিও শুধুমাত্র একটি শট নয়, বরং এটি কিছু শটের রিদমের সাথে সংযোজন।
বাস্তব প্রয়োগে, আমরা সাধারণত একটি ভিডিওর শট কাঠামো সংগঠিত করতে «চার-গ্রিড» এবং «নয়-গ্রিড» ব্যবহার করি—অর্থাৎ, একটি ভিডিওতে 4 বা 9টি শট ব্যবহার করে একটি সম্পূর্ণ প্রকাশ করা।
চারটি বক্স এবং নয়টি বক্সের পছন্দ, মূলত গতি নিয়ন্ত্রণের বিষয়:
ধীর গতির দৃশ্য: যেমন শুরুতে পরিবেশ প্রস্তুত করা বা শেষে আবেগ সমাপ্ত করা, চারটি গ্রিড পর্যাপ্ত—চারটি শটের মধ্যে প্রতিটি দৃশ্যের জন্য পর্যাপ্ত শ্বাসের জায়গা থাকে।
দ্রুত গতির দৃশ্য: যেমন যুদ্ধের চূড়ান্ত দৃশ্য, যেখানে উত্তেজনা তৈরি করতে ক্যামেরা শটগুলি ঘন ঘন পরিবর্তন করা হয়, এই সময় নাইন-গ্রিড ব্যবহার করে নয়টি শটকে একটি ভিডিওতে চাপিয়ে দেওয়া হয়, যা সম্পাদনার অনুভূতি সম্পূর্ণভাবে পরিবর্তন করে দেয়।
লেন্স এবং রিদম বুঝতে পারলে, আপনি বাস্তব তৈরির দিকে এগিয়ে যেতে পারেন: বিমূর্ত গল্পকে বিশেষ দৃশ্যে পরিণত করুন।
চরিত্রের তিনটি দৃশ্য এবং স্থানের রেফারেন্স ইমেজ প্রস্তুত হয়ে গেলে, পরবর্তী পদক্ষেপ হলো আগে লেখা স্কিপ্ট বর্ণনাগুলিকে একটি একটি করে ভিজুয়ালাইজড ইমেজে পরিণত করা। কারণটি খুব সহজ: AI একটি “নির্দিষ্ট ফ্রেম” প্রক্রিয়াকরণে বেশি দক্ষ, যখন “ধারাবাহিকভাবে পরিবর্তনশীল প্রক্রিয়া” নয়, এবং এটি কার্ড টানার হারও ব্যাপকভাবে কমিয়ে দেয়।
নির্দিষ্ট পদ্ধতি হল:
প্রতিটি শট জেনারেট করার জন্য, প্রথমে চরিত্রের তিনটি দৃশ্য এবং সংশ্লিষ্ট স্কেন রেফারেন্স ইমেজগুলি ChatGPT চ্যাটে আপলোড করুন, তারপর সম্প্রতি বিভাগীয় চিত্রের জেনারেশন প্রম্পট ইনপুট করুন।
আমাকে গল্পের সারাংশ এবং সিন বর্ণনা (পূর্ববর্তী AI-জেনারেটেড সিন টেক্সট সহ) ব্যবহার করে একটি চার-গ্রিড সিন আর্ট তৈরি করুন, স্কিন ইমেজ এবং চরিত্র ইমেজ সহ।
আপনি যে স্ক্রিপ্ট তথ্য প্রদান করেন, মডেল সেটিকে চারটি দৃশ্যে বিভক্ত করবে এবং চরিত্র এবং পরিবেশের সামঞ্জস্যতা বজায় রাখবে, ফলাফল নিম্নরূপ:

💡 ছোট টিপস, টেক্সট টু ইমেজে কয়েকটি প্রায়শই দেখা যায় এমন ফাঁদ আছে, আগে থেকে জানলে অনেক প্রয়াস বাঁচবে:
একটি ব্যক্তি যে মোবাইল ফোন নিয়ে গেম খেলছে তার দৃশ্য তৈরি করতে চান, তবে AI স্বয়ংক্রিয়ভাবে ফোনের স্ক্রিনটিকে দর্শকের দিকে ঘুরিয়ে দেয়। AI-এর যুক্তি হলো “কন্টেন্টটি পড়া যাক”, যার ফলে গেম খেলাটি ছবির জন্য দূষণের কারণ হয়ে দাঁড়ায়। সঠিক পদ্ধতি হলো: “দুটি হাত দিয়ে অনুভূমিকভাবে ফোনটি ধরুন, স্ক্রিনটি ব্যক্তির মুখের দিকে, এবং ফোনের পিছনের অংশটি ক্যামেরার দিকে।”
পেশাগত শব্দগুলি এআইকে একটি পুরো পরিস্থিতি কল্পনা করতে বাধ্য করে: "নার্স" লিখলে, এআই হাসপাতালের কল্পনা করবে, "রান্নাবান্না" লিখলে, এআই রান্নাঘরের কল্পনা করবে। সঠিক পদ্ধতি হলো: আপনি যা প্রকৃতপক্ষে চান তা শুধুমাত্র বর্ণনা করুন, পেশার নাম উল্লেখ করবেন না।
টেক্সট টু ইমেজ শুধুমাত্র স্থির চিত্র তৈরি করতে পারে, "মাথা ঘুরানো" এর জন্য কোনো ভিজুয়াল অবস্থা নেই। সঠিক পদ্ধতি হলো: শুধুমাত্র এই ফ্রেমে উপস্থিত বিষয়গুলি বর্ণনা করুন।

তিন, চিত্র থেকে ভিডিওতে: প্রম্পটে অ্যাকশন লিখুন, চিত্র পুনরায় লিখবেন না
স্ক্রিপ্টগুলি প্রস্তুত রয়েছে, এখন আমরা এগুলিকে চলচ্চিত্রে পরিণত করব।
🌟 রেজিস্টার করুন এবং স্বপ্ন দেখুন
ব্রাউজার খুলুন এবং "জিমেং এআই" সার্চ করুন, অফিসিয়াল ওয়েবসাইটে যান। ডান উপরের লগইনে ক্লিক করুন, ডাওয়েন অ্যাকাউন্ট বা মোবাইল নম্বর দিয়ে রেজিস্টার করুন, চীনের ভিতরে সরাসরি অ্যাক্সেস করা যায়।
নতুন ব্যবহারকারীরা 15 সেকেন্ডের একটি ভিডিও বিনামূল্যে তৈরি করতে পারেন, যদি আপনি সদস্যতা চান, তবে Biteye ছোট বোনও Seedance 2.0-এর সমস্ত প্ল্যাটফর্মের দামের তুলনা করেছেন, বিস্তারিত জানতে দেখুন: 《সমস্ত প্ল্যাটফর্মের মধ্যে Seedance 2.0-এর সবচেয়ে কম খরচে সাবস্ক্রিপশনের গাইড!》
🌟 ভিডিও প্রম্পট কীভাবে লিখবেন?
এটি এই ধাপের সবচেয়ে গুরুত্বপূর্ণ অংশ, এবং নতুনদের সবচেয়ে বেশি ভুল করার জায়গা।
প্রথমে সমস্ত রেফারেন্স ইমেজ আপলোড করুন, অর্থাৎ মেঘ একসাথে একাধিক রেফারেন্স ইমেজ আপলোড করতে পারে, শুধু ইমেজগুলি চ্যাট বক্সে ড্র্যাগ করুন। আপনি আগের অধ্যায়ে প্রস্তুত করা সমস্ত মেটিরিয়াল—চরিত্রের তিনটি দৃশ্য, সিন রেফারেন্স ইমেজ, চার-বক্স বা নয়-বক্স সিকোয়েন্স ডায়াগ্রাম—একসাথে সবগুলি ড্র্যাগ করুন, মেঘ এই ইমেজগুলির তথ্যগুলির সমন্বয়ে ভিডিও তৈরি করবে।
এখানে অনেক নতুন ব্যবহারকারী একটি ভুল করে, যেমন পর্দায় যা আছে তা পুনরায় বর্ণনা করে। অর্থাৎ, স্বপ্ন ইতিমধ্যেই আপনার আপলোড করা ছবিটি দেখতে পাচ্ছে, তাই আপনাকে আবার বলতে হবে না যে পর্দায় কী আছে।
চিত্রে কী কিছু চলছে, কীভাবে চলছে, ক্যামেরা নিজেই কি চলছে, এবং প্রতিটি সময়ের মধ্যে কী ঘটছে।
নিচের টেমপ্লেট অনুসারে লিখুন, প্রতিটি লাইন ভিডিওর একটি সময়কালকে সূচিত করে:
উপরের স্কিচ চিত্রগুলির ভিত্তিতে একটি ভিডিও তৈরি করুন।
[শুরুর সেকেন্ড থেকে শেষের সেকেন্ড], [দৃশ্যের ধরন], [ক্যামেরা মোশন], [চরিত্র বা বিষয়]+[নির্দিষ্ট ক্রিয়া], সাউন্ড ইফেক্ট: [শব্দের বর্ণনা]।

🌟 শব্দ বর্ণনা হল নতুনদের সবচেয়ে বেশি উপেক্ষিত অংশ, যদি ভিডিওতে কথা থাকে, তবে শুধুমাত্র “কথা বলা” লিখলে যথেষ্ট নয়, মডেলটি একটি দৈবিক শব্দ তৈরি করবে। একাধিক ভিডিওতে চরিত্রের কণ্ঠস্বর একই রাখতে, দুটি পদ্ধতি রয়েছে:
১️⃣ প্রথম অংশের অডিওকে রেফারেন্স হিসেবে ব্যবহার করুন
প্রথম ভিডিওটি তৈরি করুন, এবং উত্পাদিত ফলাফলে সন্তুষ্ট হলে এই ভিডিওর অডিওটি আলাদাভাবে রপ্তানি করুন। পরবর্তী প্রতিটি অংশ তৈরি করার সময়, এই অডিওটি শব্দের রেফারেন্স হিসাবে আপলোড করুন, যাতে মেইনড এই স্বরের সন্ধান করে পরবর্তী অংশগুলির কণ্ঠস্বর তৈরি করে, যাতে স্বরের সামঞ্জস্যতা বজায় থাকে।
২️⃣ ফিশ অডিও ব্যবহার করে রেফারেন্স স্বর খুঁজুন
ফিশ অডিও খুলুন, চরিত্রের সাথে মানানসই স্বর খুঁজুন, শুনে দেখুন এবং একটি রেফারেন্স অডিও ডাউনলোড করুন। প্রতিটি ভিডিও জেনারেট করার সময় এই রেফারেন্স অডিওটি ব্যবহার করুন, যাতে সম্পূর্ণ ভিডিওতে সাউন্ড একসমান থাকে।
🌟 প্রতীক ব্যবহার করে এআই ভয়েস আউটপুটের টোন নিয়ন্ত্রণ করুন
একটি এআই ভয়েস মডেলের জন্য ডায়ালগ লিখুন, শুধু টেক্সট ঢুকিয়ে দেওয়া শেষ কথা নয়। একই বাক্যের জন্য, বিভিন্ন বিরামচিহ্ন ব্যবহার করলে উচ্চারণের স্বরভঙ্গি সম্পূর্ণভাবে ভিন্ন হতে পারে।
মূল যুক্তি হল: বিরাম চিহ্ন বিরতি নিয়ন্ত্রণ করে, বিরতি আবেগ নির্ধারণ করে।
…… প্রশ্ন বন্ধ করে কিন্তু শ্বাস চলতে থাকে, চিন্তা, দ্বিধা বা অসমাপ্ত কথার জন্য উপযুক্ত।
……! এটি একটি চাপের পর হঠাৎ বিস্ফোরণ।
() প্রতিটি বন্ধনীর ভিতরের কন্টেন্টের ভলিউম স্বয়ংক্রিয়ভাবে কমিয়ে দেওয়া হয়, যা মনের মধ্যে আত্মকথা এবং নিজের সাথে কথা বলার জন্য উপযুক্ত।
*কনটেন্ট* তারকাচিহ্ন দিয়ে ঘিরা শব্দগুলি আরও নিচে, আরও ধীরে এবং আরও ভারী হবে, যা গুরুত্বপূর্ণ তথ্যকে জোর দেওয়ার জন্য ব্যবহার করা হয়।
[] বন্ধনীর মধ্যে নির্দেশ লিখুন, যেমন [গভীর শ্বাস নিন], [১ সেকেন্ড থামুন], মডেল কাজটি করবে এবং বলবে না।
💡 ছোট টিপস:
এআই-এর দিক বোধ নেই, এটি প্রায়শই বাম ও ডান পার্থক্য করতে পারে না, তাই এআইকে মানুষের গতিপথ বুঝতে অতিরিক্তভাবে "স্থানীয় সম্পর্কের রেফারেন্স চিত্র" দেখাতে হয়, যেমন চিত্র-একে। একটি সহজ পদ্ধতি হল: মানুষের গতিপথ বর্ণনা করতে তীরচিহ্ন ব্যবহার করুন, এবং শেষে "তীরচিহ্নগুলি মুছে ফেলুন" যোগ করুন।
ধীরে লিখুন, দ্রুত লিখবেন না। মডেল ধীর গতির ক্রিয়াকলাপকে দ্রুত গতির ক্রিয়াকলাপের চেয়ে অনেক বেশি স্থিতিশীলভাবে প্রক্রিয়া করে। দ্রুত গতির দৃশ্যগুলির প্রয়োজন হলে, মডেলকে দ্রুত ক্রিয়াকলাপ তৈরি করতে বাধ্য করার পরিবর্তে ক্লিপের গতি বাড়ানোই প্রাধান্য দিন।
প্রতিটি ভিডিও সেগমেন্টের জন্য রেফারেন্স ছবি আপলোড করুন, শুধু একবার আপলোড করবেন না। মডেলটি সেগমেন্টের মধ্যে মেমোরি রাখে না, তাই রেফারেন্স ছবি আপলোড না করলে চরিত্রের চেহারা বিচ্যুত হয়ে যাবে।

চতুর্থ: ফ্রেম থেকে পুরো ভিডিওতে: এডিটিং ভিডিওর চূড়ান্ত মান নির্ধারণ করে
এডিটিং এবং পোস্ট-প্রোডাকশন হল পুরো প্রক্রিয়ার সবচেয়ে গুরুত্বপূর্ণ ধাপ, যেখানে আগের প্রতিটি মেটেরিয়াল স্বতন্ত্র, রঙের পার্থক্য থাকতে পারে, গতি অসংগঠিত এবং শব্দ বিচ্ছিন্ন, এবং এডিটিংয়ের কাজ হল এই টুকরোগুলিকে একটি সম্পূর্ণ গল্পে গড়ে তোলা।
ভিডিওতে সঙ্গীত যোগ করলে দর্শকদের আবেগ আরও বেড়ে যায়, সাবটাইটেল যোগ করলে ডায়ালগ আরও স্পষ্ট হয়। একই ম্যাটেরিয়াল দিয়ে, ভালোভাবে এডিট করলে এবং খারাপভাবে এডিট করলে, চূড়ান্ত ফলাফলের মধ্যে এক মাত্রার পার্থক্য হতে পারে।
চারটি ধাপে কাজ করুন: মেটেরিয়াল সাজান → টোন একটি করুন → শব্দ যোগ করুন → সাবটাইটেল যোগ করুন, তারপর এক্সপোর্ট করুন।
প্রথম ধাপ: উপাদানগুলি সাজান
কাপিং খুলুন, সমস্ত ক্লিপগুলি দৃশ্যের ক্রম অনুযায়ী টাইমলাইনে টেনে আনুন। প্রথমে টোন এবং শব্দের বিষয়ে চিন্তা করবেন না, ক্রমটি নিশ্চিত করুন, সমগ্র গতি পরীক্ষা করুন এবং যেসব ক্লিপ খুব দীর্ঘ, সেগুলির অতিরিক্ত অংশ এই ধাপে কেটে ফেলুন।
দ্বিতীয় ধাপ: একটি সমন্বিত রং ব্যবহার করুন
ভিন্ন সময়ে তৈরি করা ক্লিপগুলির রংয়ের তাপমাত্রা এবং উজ্জ্বলতা সামান্য পার্থক্য থাকতে পারে, যা একসাথে রাখলে বিচ্ছিন্ন মনে হয়। সমাধান: সমস্ত ক্লিপগুলি সিলেক্ট করুন, এবং "রেগুলেট" এ একটি ফিল্টার যোগ করুন—প্রথম দৃশ্যের জন্য শীতল নীল টোন, দ্বিতীয় দৃশ্যের পরে উষ্ণ হলুদে পরিবর্তন করুন, যাতে প্রতিটি দৃশ্যের ভিতরে রংয়ের সামঞ্জস্যতা বজায় থাকে।
তৃতীয় ধাপ: ব্যাকগ্রাউন্ড সংগীত এবং সাউন্ড ইফেক্ট যোগ করুন
ভিডিও তৈরির সময় ডায়ালগ সাউন্ড ইতিমধ্যে প্রক্রিয়াকরণ করা হয়েছে, এই ধাপটি মূলত দুই ধরনের শব্দ যোগ করে: ব্যাকগ্রাউন্ড মিউজিক এবং পরিবেশগত সাউন্ড ইফেক্ট।
ব্যাকগ্রাউন্ড সংগীত মোট আবেগের ভিত্তি নির্ধারণ করে, এর ভলিউম ডায়ালগের 30% এর নিচে রাখুন, মানুষের কণ্ঠকে ঢাকবেন না।
চতুর্থ ধাপ: সাবটাইটেল যোগ করুন
শিম্পিং-এর "স্মার্ট সাবটাইটেল" ব্যবহার করে ডায়ালগ স্বয়ংক্রিয়ভাবে শনাক্ত করুন, তারপর ভুল বানান পরীক্ষা করুন এবং ফন্ট এবং অবস্থান এককভাবে সাজান। পরিচালকের বা নিজের সাথে কথা বলার ডায়ালগগুলির জন্য, এটি সাধারণ ডায়ালগ থেকে আলাদা করতে ইটালিক বা ভিন্ন রঙ ব্যবহার করুন।
পাঁচ: টুল থেকে প্রকাশে: এআই ভিডিও কী পরিবর্তন করেছে
গত প্রবন্ধে, "GPT Image 2.0 সহ সিড্যান্স 2.0: প্রত্যেকেই হলিউড ব্লকবাস্টার তৈরি করতে পারবেন", আমরা মনে করি যে AI যুগে: "ভিডিও তৈরি" এর বাধা কমে গেছে, ভবিষ্যতে প্রত্যেকেই হলিউড ব্লকবাস্টার তৈরি করতে পারবেন।
কিন্তু কম বাধা বলে তুমি এটি করতে পারবে এমন নয়।
সরঞ্জামগুলি সব প্রকাশ্যে উপলব্ধ, টিউটোরিয়ালগুলিও সব জায়গায় পাওয়া যায়, কিন্তু বেশিরভাগ মানুষ একই জায়গায় আটকে যায়: কখনও একবারও সম্পূর্ণভাবে চালানো হয়নি।
এই আর্টিকেলে, Biteye আপনাকে একটি অস্পষ্ট ধারণা থেকে শুরু করে একটি সম্পূর্ণ ভিডিওতে পরিণত করার প্রক্রিয়াটি ধাপে ধাপে দেখিয়েছে।
অতীতে, এই প্রক্রিয়াটি একটি সম্পূর্ণ পেশাদার বিভাগীয় বিভাজন প্রয়োজন করত: স্ক্রিপ্টরাইটার, স্টোরিবোর্ড, আর্ট, ক্যামেরা ও এডিটিং, প্রতিটি ধাপই একটি বাধা ছিল।
এবং এখন, এই ধাপগুলি অদৃশ্য হয়ে যায়নি, শুধু একটি প্রক্রিয়ায় সংকুচিত হয়েছে।
এর অর্থ একটি আরও মৌলিক পরিবর্তন: ভিডিও এখন প্রযোজনা ক্ষমতার ফলাফল নয়, বরং প্রকাশের ক্ষমতার ফলাফল হয়ে উঠছে।
