Tác giả: Đội ngũ nội dung Changan I Biteye
Sau Tết Nguyên Đán 2026, các diễn viên ở Hành Điện bắt đầu đăng video phàn nàn trên Douyin vì không có vai diễn.
Nhóm của đoàn phim trở nên yên lặng, trước đây, sau Tết Nguyên Đán nhưng chưa đến Rằm tháng Giêng, thông báo đã đến, năm nay đợi đến cuối tháng hai vẫn không có một cái nào.
Trong dịp Tết năm nay, mô hình tạo video Seedance 2.0 thuộc sở hữu của ByteDance đã lặng lẽ ra mắt và lan rộng khắp ngành phim ngắn.
Bài viết này muốn làm rõ ba điều:
- Sau Seedance 2.0, ngành này đã xảy ra những gì?
- Làm thế nào để tạo ra các phim ngắn AI?
- Và điều này mang lại cơ hội gì cho người bình thường.
Một mô hình đã thay đổi toàn bộ ngành công nghiệp
Trong dịp Tết Nguyên Đán, mô hình tạo video SeeDance 2.0 thuộc sở hữu của ByteDance chính thức ra mắt, Tim từ TV Hurricane đã lặp lại từ “kinh khủng” sáu lần trong video thử nghiệm thực tế.
Nó tái định hình toàn bộ ngành công nghiệp video từ khâu sản xuất: bạn không cần đoàn quay phim, không cần diễn viên, không cần địa điểm, chỉ cần một đoạn mô tả văn bản và một hình ảnh tham khảo, vài phút là có thể tạo ra một video sẵn sàng để phát hành.
Sau khi mức ngưỡng được hạ xuống, hai nhu cầu trước đây khó được đáp ứng đã được giải phóng.
- Biến những cảnh quay không thể chụp được thành video: Tạo nội dung mới cho các tác phẩm điện ảnh và truyền hình, ví dụ: "Bạn có từng cứu một con cáo dưới chân núi Thiên Sơn không?"
- Những cảnh tượng bạn muốn xem nhưng không thể thấy: Đây là nhu cầu thiết yếu về mặt cảm xúc, có những cảnh tượng có thể sẽ không bao giờ có cơ hội được quay lại, và AI đã mang đến cho những cảnh tượng này cơ hội tồn tại.
Hai điều này kết hợp lại cho thấy cùng một điều: Sau khi các công cụ tạo video AI ra đời, cách sử dụng phương tiện video đã thay đổi. Nó không còn là sản phẩm độc quyền của các đội ngũ chuyên nghiệp và thiết bị chuyên dụng, mà đã trở thành thứ mà bất kỳ ai cũng có thể dùng để thể hiện bản thân, gửi gắm cảm xúc, hoặc đơn giản chỉ để giải trí.
Khả năng này đã thúc đẩy sự bùng nổ của hai loại nội dung video.
1️⃣ Nội dung video ngắn lấy giải trí và lưu lượng làm trung tâm
Nội dung này không phức tạp như các bộ phim ngắn, không cần quan tâm đến tính nhất quán nhân vật giữa các video, cũng không cần duy trì cốt truyện liên tục, về bản chất là tách rời những công việc lặp đi lặp lại nhàm chán để AI thay thế.
Điển hình nhất là phát sóng bằng người số hóa AI, cách thực hiện rất đơn giản: tải lên một bức ảnh của chính bạn để tạo hình ảnh người số hóa, soạn sẵn nội dung, AI sẽ tự động đồng bộ hóa chuyển động môi, lồng tiếng và xuất hình ảnh.
Một loại khác là trực quan hóa các câu chuyện hài hước. Nhiều câu chuyện hài hước chỉ tồn tại dưới dạng văn bản trên mạng, có điểm gây cười nhưng không có hình ảnh, nên khả năng lan truyền bị hạn chế. Hiện nay, có người chuyên chuyển đổi những câu chuyện này thành video, thêm phụ đề và lồng tiếng, biến một câu chuyện hài hước dạng hình ảnh thành một video ngắn.
2️⃣ Phim ngắn AI lấy cốt truyện làm trung tâm
Hướng phim ngắn phức tạp hơn nhiều so với video ngắn, vì cốt truyện là liên tục, cùng một nhân vật phải xuất hiện từ tập đầu tiên đến tập sáu mươi, khuôn mặt không được thay đổi, trang phục không được thay đổi, và phong cách cảnh quay cần được duy trì nhất quán. Yêu cầu về tính nhất quán này đã làm tăng mức độ khó của quy trình làm việc lên một cấp độ.
Do hạn chế của ByteDance đối với hình ảnh người thật, nhiều nhà sáng tạo đã chuyển sang các hướng không cần khuôn mặt người thật—truyện tranh.
Sử dụng nhân vật hoạt hình được tạo bởi AI để thay thế diễn viên thật, bộ phim tránh được các vấn đề tuân thủ, đồng thời vô tình mở ra một cánh cửa khác: chuyển thể IP văn học trực tuyến. Các thể loại huyền huyễn, lật ngược số phận, hệ thống—những thể loại có hàng trăm triệu độc giả trên Tam Cà và Khởi Điểm—tự nhiên rất phù hợp để chuyển thành các phim ngắn hoạt hình.
Hai: Từ kịch bản đến thành phẩm: Toàn bộ quy trình sản xuất một bộ phim ngắn AI
Nhiều người xem một video và nghĩ rằng chỉ cần nhập một đoạn mô tả cốt truyện, mô hình sẽ tự động tạo ra.
Thực tế không phải như vậy; một bộ phim ngắn AI chất lượng tốt đằng sau là một quy trình làm việc có thứ tự rõ ràng, mỗi bước đều có công cụ tương ứng, và chất lượng của từng bước đều ảnh hưởng trực tiếp đến thành phẩm cuối cùng.
Bước 1: Viết kịch bản phân cảnh
Bản thảo yêu cầu bạn phải viết rõ ràng từng cảnh. Định dạng tương tự như sau: Cảnh 3, nhà bếp, cận cảnh, nam chính lấy nguyên liệu từ tủ lạnh,镜头 chuyển từ tay sang khuôn mặt, biểu cảm mệt mỏi, thời lượng 5 giây, phụ đề: “Lại đến lúc này rồi.”
Càng chi tiết bước này, bước tạo sau này càng ổn định. Mô hình AI hiểu các chỉ dẫn hình ảnh rõ ràng, không phải cảm giác câu chuyện mơ hồ. Khi kịch bản phân cảnh được viết tốt, tính ngẫu nhiên ở từng bước sau đó sẽ giảm xuống.
Bước 2: Xây dựng thư viện hình ảnh tham khảo cho nhân vật và bối cảnh
Đây là bước dễ bị bỏ qua nhất nhưng cũng không thể bỏ qua trong toàn bộ quy trình.
Vấn đề lớn nhất của video do AI tạo ra không phải là độ phân giải, mà là tính nhất quán. Cùng một nhân vật, tập trước là khuôn mặt này, tập sau lại đổi thành khuôn mặt khác. Màu nền bị lệch, chi tiết trang phục biến mất. Nếu không có hình tham chiếu cố định để ràng buộc, thì gần như không thể thực hiện được một bộ phim truyền hình dài trên ba tập.
Giải pháp là trước khi sản xuất video chính thức, hãy sử dụng công cụ tạo hình để “cố định” nhân vật — tạo một hình ảnh từ góc nhìn trước, góc nghiêng, góc ba phần tư và mắt, đồng thời cố định màu tóc, màu da, trang phục và phong cách. Thực hiện tương tự cho các cảnh chính. Thư viện hình ảnh này sẽ được sử dụng làm cơ sở cho tất cả các cảnh sau này, là nền tảng của toàn bộ quy trình làm việc.
⚠️ Một mẹo nhỏ: Nếu bạn muốn sử dụng Jimeng để tạo video người thật, hãy thêm hiệu ứng mờ mắt vào ảnh chân dung trực diện và thêm chữ “Người này do AI tạo ra” lên hình, đồng thời hiển thị riêng mắt ở một phần khác của hình ảnh để vượt qua giới hạn phát hiện khuôn mặt của nền tảng.
Bước 3: Kiểm soát tỷ lệ rút thẻ bằng khung hình đầu tiên
Những người từng làm video AI đều biết đến từ “bốc thẻ”. Xác suất để đoạn video được tạo ra có thể sử dụng ngay là bao nhiêu? Chất lượng prompt và hình ảnh tham khảo đủ tốt có thể giảm đáng kể số lần bốc thẻ.
Cách làm của đội ngũ chuyên nghiệp là sử dụng công cụ tạo hình ảnh để tạo khung hình đầu tiên của mỗi cảnh, sau đó sử dụng hình ảnh này làm tài liệu tham khảo để Seedance tạo ra các chuyển động tiếp theo từ khung hình đó.
Trong bước này, chất lượng công cụ tạo hình ảnh trực tiếp quyết định giới hạn cao nhất của video cuối cùng. Hình ảnh tạo ra càng tốt và chi tiết càng ổn định, thì video đầu ra sau khi đưa vào Seedance sẽ càng chất lượng.
Đây cũng là lý do GPT Image 2 gây ra tác động lớn đến toàn bộ ngành, vì khả năng hiểu mô tả hình ảnh của GPT Image 2 đã bước lên một cấp độ mới—chỉ cần cung cấp một đoạn mô tả cảnh tượng là có thể tạo ra hình ảnh tham chiếu chất lượng cao, khuôn mặt ổn định hơn và phong cách dễ kiểm soát hơn. Khi chất lượng hình ảnh tham chiếu được nâng cao, chất lượng thành phẩm ở tất cả các khâu tiếp theo cũng theo đó mà cải thiện, tạo nên một phản ứng dây chuyền.
Bước 4: Cắt ghép
Sau khi xác nhận đoạn phim, hãy ghép chúng bằng công cụ chỉnh sửa như CapCut hoặc các công cụ khác, thêm phụ đề, lồng tiếng và nhạc nền. Seedance 2.0 hỗ trợ tạo hiệu ứng âm thanh và nhạc nền đồng thời với việc tạo video, việc đồng bộ hóa chuyển động môi và âm thanh đã khá ổn định, tính năng này có thể tiết kiệm đáng kể khối lượng công việc hậu kỳ.
Ba, Phim ngắn truyền thống so với phim ngắn AI: Một cuộc chiến không cân sức
Đã nói nhiều về quy trình, vậy chi phí là bao nhiêu? Một bộ phim ngắn AI 60 tập rốt cuộc cần chi bao nhiêu tiền? So với phim ngắn truyền thống có diễn viên thật, sự chênh lệch lớn đến đâu?
- Thành viên tiêu chuẩn: Gói đăng ký liên tục hàng tháng với giá 199 nhân dân tệ, bao gồm 2.210 điểm mỗi tháng, có thể tạo khoảng 200 giây video, tương đương chi phí khoảng 1 nhân dân tệ mỗi giây.
- Thành viên cao cấp: Gói đăng ký hàng tháng liên tục với giá 499 nhân dân tệ, bao gồm 6.160 điểm tích lũy, có thể tạo ra khoảng 560 giây video, chi phí mỗi giây giảm xuống khoảng 0,89 nhân dân tệ.
Nhưng giá này không luôn như vậy.
Năm nay, Dream đã nhiều lần tăng giá, mức giá cũ cho gói thành viên hàng năm là 2599 nhân dân tệ, tương đương 216 nhân dân tệ mỗi tháng và được hưởng 15.000 điểm tích lũy mỗi tháng.
Phí thành viên hàng năm đã tăng lên 5.199 nhân dân tệ, và vào tháng 4 năm nay, điểm tích lũy hàng tháng đã bị giảm trực tiếp từ 15.000 xuống còn 6.160, giảm hơn 60% điểm tích lũy, tương đương với thời lượng video có thể tạo ra với cùng ngân sách giảm hơn một nửa, chi phí thực tế tăng 60%.
Mỗi giây video được tạo bởi ZaiMeng tiêu tốn 11 điểm tích lũy; một tập phim ngắn được tính theo 1 phút, chi phí thực tế cho một tập video ngắn mà không rút thẻ nào khoảng 46 nhân dân tệ.
Tỷ lệ rút thẻ thay đổi đáng kể tùy theo chất lượng từ khóa và độ phức tạp của cảnh, tính trung bình mỗi video cần tạo 4 lần để có được một đoạn phim hữu dụng: chi phí tính toán thực tế cho một tập phim ngắn khoảng 184 nhân dân tệ. Đây vẫn là trong điều kiện từ khóa ổn định và cảnh tương đối đơn giản. Nếu cốt truyện phức tạp, chuyển động nhân vật lớn, số lần rút thẻ sẽ còn nhiều hơn.
Ngoài chi phí tính toán, còn có chi phí vận hành. Một đội ngũ nhỏ sản xuất phim ngắn AI thường gồm 3 đến 5 người, bao gồm biên kịch, chuyên gia bốc thẻ và biên tập, chi phí nhân sự cộng với tiền thuê văn phòng và điện nước hàng tháng dao động khoảng 35.000 đến 70.000 nhân dân tệ. Nếu chia đều cho 10 phim mỗi tháng, sau khi cộng chi phí vận hành, chi phí tổng hợp mỗi tập phim thường dưới 500 nhân dân tệ.
Các phim ngắn thực tế truyền thống được phân loại theo thể loại nam và nữ, với sự khác biệt rõ rệt về chi phí.
- Phim nam tính: Nhiều cảnh hành động và hiệu ứng đặc biệt, chi phí sản xuất một bộ phim 60 tập thường trên 500.000 nhân dân tệ, tương đương khoảng 8.300 nhân dân tệ mỗi tập;
- Phim dành cho nữ giới: Chủ yếu tập trung vào cốt truyện tình cảm, chi phí tương đối dễ kiểm soát, khoảng 350.000 đến 400.000 nhân dân tệ cho 60 tập, chi phí mỗi tập khoảng 5.800 đến 6.700 nhân dân tệ.
So sánh với đó, chi phí tổng hợp cho mỗi tập phim ngắn AI, ngay cả khi cộng thêm chi phí vận hành nhóm, không vượt quá 500 nhân dân tệ. Cùng một tập phim ngắn, sự chênh lệch chi phí giữa sản xuất truyền thống với diễn viên thật và sản xuất bằng AI nằm trong khoảng 15 đến 40 lần.
Sự chênh lệch này có nghĩa là trong các phim ngắn truyền thống, mỗi tác phẩm đều đặt cược hàng chục nghìn đô la; nếu lựa chọn chủ đề sai, đó sẽ là một tổn thất nghiêm trọng và cả đội ngũ có thể mất vài tháng mới phục hồi. Trong khi đó, chi phí mỗi tập phim ngắn do AI sản xuất chỉ vài trăm nhân dân tệ, với cùng một ngân sách, bạn có thể đồng thời thử nghiệm mười chủ đề khác nhau, dùng số lượng để đổi lấy xác suất và dùng tốc độ để nắm bắt cơ hội.
Bốn, điều này có ý nghĩa gì đối với người bình thường, có cơ hội không?
Năm 2025, quy mô thị trường phim ngắn Trung Quốc đạt 67,79 tỷ nhân dân tệ, với số người dùng lên tới 696 triệu, hơn một nửa người dùng internet Trung Quốc đều xem phim ngắn. Đây là môi trường người xem cho phim ngắn AI, không cần phải nuôi dưỡng một thị trường mới, phim ngắn AI đã hình thành thói quen thanh toán ổn định.
Trên nền tảng này, TikTok cũng bắt đầu chủ động đẩy lưu lượng và vốn vào các video gốc AI.
Douyin phối hợp với Jimeng ra mắt "Kế hoạch làn sóng sáng tạo AI S2": Mỗi hai tuần sẽ đánh giá tổng hợp 10 nội dung chất lượng cao, nội dung thông thường được thưởng 1.500 nhân dân tệ tiền mặt, các tác giả lọt top còn được ưu tiên nhận cơ hội hợp tác ngành, cơ hội đơn hàng thương mại và hỗ trợ nộp đề xuất dự án phim ngắn.
Dưới sự khuyến khích của nền tảng, làn sóng sáng tạo trên TikTok tháng này đã xuất hiện một loạt nội dung có chất lượng rõ ràng cao hơn trước đây. Các phim ngắn公益 AI như “Giấy Máy Bay”, “Mẫu Giáo Trăm Tuổi”, “Tạm Biệt” đều nhận được số lượt thích cao.
Con đường chuyển đổi doanh thu cũng rất trực tiếp: các nhà sáng tạo trong nước có thể đồng thời theo đuổi ba hướng: chia sẻ lưu lượng truy cập từ nền tảng, hoa hồng CPS từ Fanqie Novel, và đơn hàng thương hiệu.
- Tài khoản có từ 1 đến 50.000 người theo dõi, mức giá cho mỗi bài đăng quảng cáo từ 500 đến 2.000 nhân dân tệ;
- 5 đến 10 vạn người theo dõi, mỗi bài đăng từ 2.000 đến 5.000 nhân dân tệ;
- Từ 100.000 đến 500.000 người theo dõi, mỗi bài đăng có thể đạt từ 5.000 đến 20.000 nhân dân tệ.
Nền tảng còn có chương trình chia sẻ lưu lượng, kế hoạch video trung bình trên Douyin khoảng 60 nhân dân tệ mỗi 10.000 lượt phát, Kuaishou Cilijuxing khoảng 40 nhân dân tệ mỗi 10.000 lượt phát, mức yêu cầu đều không cao.
Các nhà quảng cáo cho các chiến dịch quảng bá trò chơi, thu hút người dùng mới cho ứng dụng, và chèn thương hiệu vốn đã đầu tư mạnh vào nội dung phim ngắn; phim ngắn AI chỉ cung cấp cho họ một lựa chọn chi phí thấp hơn.
Viết ở cuối
Với quy mô thị trường lớn như vậy, thì ai phù hợp để tham gia?
Người không có kinh nghiệm gì thì tốt nhất không nên bắt đầu ngay với phim ngắn. Phim ngắn yêu cầu cao về tính nhất quán của nhân vật và sự liên tục của cảnh quay, quy trình làm việc phức tạp và chi phí thử nghiệm cũng không thấp; con đường thực tế hơn là bắt đầu từ các video ngắn để rèn luyện.
Trên Douyin, có rất nhiều tài khoản chuyển đổi các đoạn văn bản phổ biến trên mạng thành video, không cần cốt truyện liên tục, không cần nhân vật cố định, mỗi video là một nội dung độc lập. Những tài khoản này tăng lượng người theo dõi nhanh và có lượng xem cao, phù hợp để xây dựng IP và nền tảng khán giả của riêng bạn. Quan trọng hơn, các video này gần như không cần quan tâm đến tính nhất quán về nhân vật và bối cảnh, giúp bạn có thể tập trung hoàn toàn vào việc lựa chọn chủ đề và nhịp điệu nội dung.
Sau khi tài khoản đã hoạt động ổn định và bạn đã làm quen với các công cụ cũng như quy tắc của nền tảng, hãy dần nâng cao chất lượng nội dung và thử nghiệm các quy trình sản xuất phim ngắn phức tạp hơn.
Chưa có người dẫn đầu thực sự trong lĩnh vực phim ngắn AI, các công cụ đang được cải tiến và quy trình làm việc đang phát triển; một đội ngũ hôm nay chạy thành công một quy trình thì ngày mai có thể bị các mô hình tốt hơn làm thay đổi hoàn toàn. Điều này có nghĩa là lợi thế đi trước không lớn như tưởng tượng, và những người đến sau vẫn còn cơ hội.
