Gemini Omni so với Seedance 2.0: Ai mới là vua mô hình video thực sự?

icon MarsBit
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Tin tức về tài sản thực tế (RWA) tiếp tục phát triển, với tin tức AI + tiền mã hóa chiếm vị trí trung tâm. Gemini Omni và Seedance 2.0 là hai công cụ video AI hàng đầu, mỗi công cụ đều có những điểm mạnh riêng biệt. Gemini, đến từ Google, hỗ trợ đầu vào đa mô-đun và chỉnh sửa video. Seedance 2.0 mang lại chất lượng điện ảnh và độ ổn định chuyển động vượt trội. Gemini tạo ra video nhanh hơn với nhiều tùy chọn chỉnh sửa hơn. Seedance giới hạn ở 15 giây nhưng mang lại tính nhất quán tốt hơn. Cả hai công cụ đều phản ánh xu hướng ngày càng tăng của AI + tiền mã hóa.

Tác giả: Đội ngũ nội dung Changan I Biteye

Google đã trình diễn khả năng của Gemini Omni tại sự kiện ra mắt, cho phép nó nhận đầu vào là văn bản, hình ảnh, âm thanh và video để tạo ra video, đồng thời có thể tiếp tục chỉnh sửa thông qua hội thoại. Theo thông báo chính thức, Gemini Omni sẽ thay thế Veo trong ứng dụng Gemini, hỗ trợ tạo video 10 giây, tạo âm thanh bản địa, tạo hình ảnh tham chiếu và chỉnh sửa video từ video.

Trước đó, trong cộng đồng sáng tạo, các video AI gần như không thể bỏ qua Seedance 2.0, với những ưu điểm rõ ràng: chuyển động ổn định, cảm giác镜头 mạnh, tạo âm thanh và hình ảnh đồng bộ, và mang lại cảm giác hoàn chỉnh cho video ngắn.

Vậy nên vấn đề đặt ra là:

Gemini Omni và Seedance 2.0 so sánh với nhau thì khác biệt ở đâu? Ai phù hợp hơn với người sáng tạo? Bài viết này so sánh từ ba góc độ thực tế: chi phí giá cả, trải nghiệm sản phẩm và chất lượng video.

I. So sánh giá: Chi phí thực sự đắt của mô hình video là "chi phí ảnh phế phẩm"

Hãy bắt đầu với vấn đề thực tế nhất: Một lần dùng hết hết bao nhiêu tiền?

Lần so sánh này giữa Gemini Omni và Seedance, giá không chỉ nên xem xét phí đăng ký, mà còn phải xem xét hai vấn đề sau:

  • Chi phí tạo một video là bao nhiêu?

  • Cần thử lại bao nhiêu lần để tạo ra một video có thể sử dụng?

1. Gemini Omni: Gần giống mô hình “đăng ký + Flow Credits”

Gemini Omni sử dụng phương thức Google AI Membership + Flow Credits.

Theo tính toán cao cấp của AI Ultra, mỗi tháng 25.000 credit có thể tạo ra khoảng 8.333 giây video. Từ góc độ này, cấu trúc giá của Gemini rõ ràng: cấp độ càng cao, chi phí mỗi giây càng giảm rõ rệt.

Chi phí của AI Plus khoảng 0,82 nhân dân tệ/giây, thực tế không phải là rất thấp; nhưng đến AI Pro, chi phí đã giảm xuống còn 0,41 nhân dân tệ/giây. Nếu ở cấp Ultra, chỉ cần sử dụng hết hạn mức hàng tháng, chi phí mỗi giây có thể giảm xuống khoảng 0,2 nhân dân tệ/giây.

Vì vậy, Gemini Omni phù hợp hơn với hai nhóm người:

  • Người dùng đang sử dụng Google AI Pro / Ultra đã có khả năng video tương đương với việc được nhập trực tiếp vào hệ thống đăng ký hiện có

  • Người tạo video tần suất cao, vì càng tạo nhiều, chi phí trung bình càng thấp.

⚠️ Tuy nhiên, cần lưu ý: đây là chi phí được tính theo giá khu vực Mỹ. Đối với người dùng Trung Quốc, chi phí thực tế còn phải xem xét khu vực tài khoản, phương thức thanh toán và độ ổn định khi truy cập.

Seedance 2.0

2. Seedance: Tính theo giá gốc gói hàng năm của Jimeng, 10 giây tiêu tốn 140 điểm

Ji Meng sử dụng mô hình thành viên + điểm tích lũy: Thành viên sẽ nhận một số điểm nhất định mỗi tháng, và khi tạo video, điểm sẽ bị trừ dựa trên mô hình, thời lượng và độ phân giải.

Tính theo cấp độ cao, 6.160 điểm mỗi tháng có thể tạo ra khoảng 440 giây video.

Từ góc độ này, chi phí của Seedance ổn định khoảng 1 nhân dân tệ/giây. Thành viên cơ bản khoảng 1,06 nhân dân tệ/giây, thành viên tiêu chuẩn khoảng 1,00 nhân dân tệ/giây, thành viên cao cấp khoảng 0,98 nhân dân tệ/giây.

Khác với Gemini, chi phí mỗi giây giữa các cấp độ của Seedance không chênh lệch nhiều. Mặc dù thành viên cao cấp có chi phí thấp hơn, nhưng lợi thế chính không phải là sự giảm mạnh chi phí mỗi giây, mà là thời lượng video có thể tạo ra mỗi tháng nhiều hơn.

Ưu điểm của nó tập trung vào trải nghiệm sản phẩm trong nước: lối vào trực tiếp hơn, thanh toán tiện lợi hơn, môi trường tiếng Trung thân thiện hơn và phù hợp hơn cho các nhà sáng tạo trong nước nhanh chóng làm quen.

Seedance 2.0

Hai, trải nghiệm sản phẩm: Gemini giống như một quy trình làm việc, Seedance giống như một công cụ sáng tạo

1. Hiệu suất tạo: Gemini nhanh hơn, Seedance có thời gian chờ lâu hơn

Hãy xem tốc độ tạo trước.

Sau khi thử nghiệm thực tế, tôi thấy Gemini Omni tạo một video mất khoảng 2 phút, trong khi thời gian chờ đợi của Seedance lâu hơn, thường từ 5–6 phút.

Ưu điểm của Gemini là tốc độ thử nghiệm nhanh hơn. Bạn có thể thấy kết quả nhanh hơn và dễ dàng duy trì trạng thái sáng tạo.

Vấn đề của Seedance là mỗi lần chờ đợi lại kéo dài hơn, nếu kết quả không hài lòng thì phải tạo lại một phiên bản khác, chi phí thời gian sẽ tăng nhanh chóng.

Vì vậy, về mặt hiệu quả, Gemini phù hợp hơn để tạo mẫu nhanh và kiểm tra cảm hứng, trong khi Seedance phù hợp hơn để tạo hình chính thức sau khi đã hình dung rõ ràng cảnh tượng.

2. Bản ứng cử: Gemini có thể tạo nhiều nội dung cùng một lúc, tức là thiên về việc tạo từng lần một.

Trong Gemini Omni có các tùy chọn x1 / x2 / x3 / x4, ví dụ: một video 10 giây tiêu tốn 30 credits, nếu chọn x2 thì sẽ tiêu tốn 60 credits.

Vì video AI có độ không chắc chắn cao, hiệu quả tạo ra từ cùng một prompt có thể khác nhau đáng kể, nên tạo ra 4 phiên bản cùng lúc để người dùng có thể chọn ngay một phiên bản tốt nhất thay vì phải tạo lại từng cái một.

Trong khi đó, Ji Meng thiên về tạo ra từng lần một.

Vì vậy, ở đây có thể đưa ra kết luận như sau:

  • Gemini phù hợp hơn để rút thẻ nhanh và lọc

  • Ji Meng phù hợp hơn để sản xuất từng đoạn sau khi xác định rõ các tham số

3. Độ dài video: Ji Meng tối đa 15 giây, Gemini tối đa 10 giây

Sự khác biệt thứ ba là độ dài video.

Từ trải nghiệm sản phẩm hiện tại, Gemini Omni có thể tạo video dài nhất 10 giây, trong khi Jian Meng có thể tạo video dài nhất 15 giây.

Nếu bạn muốn thực hiện một cảnh hoàn chỉnh hơn, chẳng hạn như nhân vật từ lúc bước vào cửa đến khi ngồi xuống, sản phẩm từ cảnh xa đến cận cảnh, hoặc một hành động kịch tính ngắn, 10 giây đôi khi sẽ không đủ.

15 giây tuy không dài, nhưng 5 giây nhiều hơn so với 10 giây đã đủ để hoàn thành thêm một hành động hoặc một thay đổi cảnh trong video.

Vì vậy, về mặt thời lượng:

  • Gemini phù hợp hơn cho các cảnh quay ngắn và tài liệu nhanh.

  • Seedance phù hợp hơn với các đoạn video hơi dài hơn một chút.

Nếu bạn đang thực hiện phim ngắn, bản vẽ kịch bản quảng cáo hoặc kể chuyện theo cảm xúc, giới hạn 15 giây của Seedance sẽ hữu ích hơn.

4. Biên tập video: Gemini có thể tiếp tục chỉnh sửa, Seedance giống như tạo lại hoàn toàn

Trong tạo video, một vấn đề rất thực tế là: Nếu không hài lòng với bản đầu tiên thì phải làm sao?

Việc tạo hình ảnh thì vẫn ổn, rút lại một bức khác chi phí không cao; nhưng đối với video, một khi liên quan đến thời lượng, xếp hàng, điểm tích lũy và xét duyệt, mỗi lần làm lại đều làm tăng chi phí.

Về trải nghiệm sản phẩm, Gemini Omni nhấn mạnh hơn vào khả năng “chỉnh sửa”. Thay vì chỉ cho phép người dùng viết lại prompt và tạo lại, nó tích hợp video vào một quy trình sáng tạo liên tục: tạo ra một phiên bản đầu tiên, sau đó tiếp tục chỉnh sửa dựa trên kết quả hiện có, chẳng hạn như điều chỉnh khung hình, thay đổi phong cách, thay thế các yếu tố cụ thể hoặc tối ưu hóa thêm cảnh quay.

Ưu điểm của Gemini nằm ở chỗ: nó giống như biến việc tạo video thành một quá trình “có thể tiếp tục giao tiếp”.

Seedance hiện tại mang tính chất của các công cụ tạo dựng truyền thống. Điểm mạnh của nó nằm ở kết quả tạo ra, đặc biệt là hình ảnh, chuyển động và cảm giác hoàn chỉnh. Tuy nhiên, nếu phiên bản đầu tiên không ưng ý, thường bạn sẽ cần điều chỉnh lại từ khóa, hình ảnh tham khảo và các thông số, sau đó tạo lại một phiên bản mới.

5. Cơ chế kiểm duyệt: Hai bên có hướng hạn chế khác nhau

Kiểm duyệt cũng là vấn đề không thể tránh khỏi trong thực tế sử dụng, sau khi thử nghiệm, tôi nhận thấy trọng điểm kiểm duyệt của hai bên không giống nhau.

Gemini Omni có xu hướng kiểm duyệt nội dung video một cách nghiêm ngặt hơn. Một điểm rõ ràng là, ngay cả khi nội dung được chuyển thành phong cách Q hay hoạt hình, nó vẫn có thể không vượt qua được kiểm duyệt. Nói cách khác, việc phong cách trở nên “hư cấu” hơn không tự động làm nới lỏng các hạn chế.

Nhưng điều thú vị là, đối với một số nội dung liên quan đến người thật, Gemini lại không nghiêm ngặt bằng những gì tôi tưởng tượng. Chỉ cần không rõ ràng liên quan đến nhân vật nhạy cảm, vi phạm bản quyền, gây hiểu lầm hoặc nội dung rủi ro cao, một số video phong cách người thật vẫn có thể được tạo ra.

Hướng kiểm duyệt của Seedance thiên về rủi ro liên quan đến người thật và chân dung. Đặc biệt, các nội dung liên quan đến người thật, gương mặt sao, hình ảnh tương tự người nổi tiếng, nhân vật phim truyền hình, nhân vật công chúng dễ dàng bị chặn. Ngay cả khi người sáng tạo chỉ muốn thể hiện một cách giải trí, nội dung cũng có thể bị chặn.

Ba, chất lượng video: sự khác biệt thực sự không nằm ở từng khung hình, mà ở “khi đã chuyển động”

Ở cấp độ video, vấn đề quan trọng nhất trở thành: video được tạo ra có thực sự sử dụng được không?

Lần này tôi không thực hiện các bài kiểm tra phức tạp, mà bắt đầu từ các tình huống mà người sáng tạo thường dùng nhất, đã tạo ra vài nhóm nội dung thực tế, bao gồm các hướng như nhân vật đánh nhau, tạo video từ hình ảnh tham khảo, tính nhất quán của nhân vật, v.v.

Cảm nhận rõ ràng hiện nay là:

Khả năng video của Gemini Omni rất mạnh, nhưng cách biểu đạt thiên về ngữ cảnh quốc tế; Seedance sẽ tự nhiên hơn trong các phong cách hình ảnh, chuyển động nhân vật và ngữ cảnh anime mà các nhà sáng tạo Trung Quốc quen thuộc.

1. Hiểu nội dung: Gemini linh hoạt hơn, nhưng dễ bị thiên về ngữ cảnh tiếng Anh

Tôi đã thử nghiệm một cảnh video điển hình:

Tạo video hai nhân vật đang đánh nhau.

Bài kiểm tra này trông có vẻ đơn giản, nhưng thực tế rất phù hợp để quan sát khả năng “tự do phát huy” của mô hình.

Vì tôi không đặt giới hạn nghiêm ngặt về nội dung mà nhân vật nói, cũng không quy định rõ ngôn ngữ lời thoại, nên Gemini Omni sẽ chủ động bổ sung nội dung video, thậm chí tự động tạo ra lời thoại và âm thanh.

Nhưng vấn đề cũng ở đây: Sự tự do diễn đạt của Gemini rõ ràng thiên về bối cảnh nước ngoài.

Trong trường hợp không giới hạn ngôn ngữ, nhân vật trong video do nó tạo ra nói tiếng Anh. Điều này cho thấy Gemini có xu hướng tuân theo logic sản xuất nội dung tiếng Anh trong cách biểu đạt mặc định. Nếu bạn muốn tạo video ngắn tiếng Trung, nội dung tái tạo tiếng Trung hoặc cốt truyện trong ngữ cảnh tiếng Trung, bạn cần rõ ràng giới hạn trong prompt.

2. Tính nhất quán vai trò: Gemini có khả năng tham khảo hình ảnh, nhưng nhân vật vẫn có thể có sai lệch

Tôi cũng đã thử tạo video từ hình ảnh tham chiếu.

Bài kiểm tra này chủ yếu xem xét một vấn đề:

Sau khi cung cấp hình ảnh tham khảo nhân vật, nhân vật trong video có thể duy trì tính nhất quán không?

Kết quả là, Gemini Omni dù có thể tạo video từ hình ảnh tham chiếu, nhưng nhân vật trong video cuối cùng vẫn sẽ có sự khác biệt so với hình ảnh tham chiếu gốc và không thể hoàn toàn duy trì tính nhất quán về nhân vật.

Chi tiết của nhân vật sẽ có sự khác biệt nhỏ so với hình mẫu

Nếu chỉ làm video tạo không khí, video hài hước hay phim ngắn sáng tạo, thì việc thay đổi một chút nhân vật vẫn có thể chấp nhận được. Nhưng nếu muốn xây dựng nhân vật IP cố định, Omni hoàn toàn không thể đáp ứng được.

3. Tính liên tục của hành động: Gemini đôi khi giống như các đoạn ghép lại, Seedance giống hành động hoàn chỉnh hơn

Một vấn đề rõ ràng khác trong video đấu tranh là chuyển động của nhân vật không liền mạch.

Các chuyển động nhân vật trong video đấu tranh do Gemini tạo ra có vẻ hơi gượng ép, cảm giác như không phải là một hành động được quay liên tục, mà là vài đoạn chuyển động được ghép lại với nhau.

Ví dụ, các chuyển động của nhân vật từ tư thế chuẩn bị đến khi ra chiêu, né tránh, di chuyển đều có đầy đủ, nhưng các khoảng chuyển tiếp giữa chúng chưa tự nhiên, khiến video trông giống như “AI ghép vài khung hình chính lại”, thay vì một chuỗi chuyển động thực sự liên tục.

Điều này sẽ rõ ràng hơn trong các cảnh như chiến đấu, chạy, nhảy, quay người, tương tác đa người. Nếu chỉ là các cảnh đơn giản như tiến gần镜头, chuyển động nhẹ của nhân vật, hoặc trưng bày sản phẩm, vấn đề sẽ không nổi bật bằng.

Seedance trong các cảnh này sẽ gần gũi hơn với kỳ vọng của người sáng tạo. Các chuyển động và góc quay của nó thường giống như một đoạn video hoàn chỉnh, đặc biệt là trong các cảnh hoạt hình, đấu tranh, hoặc hành động được rút gọn thành video ngắn, nhịp độ tổng thể sẽ tự nhiên hơn.

4. Biên tập video: Gemini có thể chỉnh sửa video, đây là một trong những ưu điểm lớn nhất của nó

Tuy nhiên, Gemini cũng có một lợi thế rất quan trọng ở cấp độ video: nó hỗ trợ chỉnh sửa video hiện có bằng AI.

Nói cách khác, bạn có thể tải lên một đoạn video thực tế, sau đó để Gemini thực hiện chỉnh sửa AI trên nội dung trong video, chẳng hạn như sửa đổi các yếu tố trong khung hình, thay thế một số nội dung, thay đổi phong cách, hoặc kết hợp video quay thực tế với nội dung do AI tạo ra.

Điều này khác với phạm vi sản phẩm của Seedance.

Nếu bạn muốn kết hợp “hình ảnh thực tế + hình ảnh AI”, hiện tại Seedance thường sử dụng hiệu ứng chuyển cảnh: quay một đoạn video thực tế, sau đó tạo một đoạn video AI, rồi nối chúng lại bằng hiệu ứng chuyển cảnh trong quá trình dựng.

Bốn: Kết luận: Seedance tạo ra nội dung tốt hơn, Omni giống như một trình chỉnh sửa video

Sau khi so sánh lần này, cảm nhận lớn nhất là: Seedance và Gemini Omni có trọng tâm khác nhau.

Seedance giống như một công cụ tạo video AI trưởng thành, với khả năng cốt lõi là biến văn bản hoặc hình ảnh thành video.

Trong hai cảnh sử dụng phổ biến nhất là văn sinh video và hình sinh video, Seedance hiện vẫn ổn định hơn, hình ảnh của nó phù hợp với gu thẩm mỹ của các nhà sáng tạo Trung Quốc, chuyển động mượt mà hơn, và các cảnh như hoạt hình, chiến đấu, video ngắn cũng dễ tạo ra sản phẩm hơn.

Nếu nhu cầu của bạn là biến prompt thành video hoặc biến một hình ảnh thành cảnh động, thì Seedance là lựa chọn tốt nhất hiện nay.

Tuy nhiên, điểm nổi bật của Omni là nó hỗ trợ chỉnh sửa AI đối với các video đã có.

Điều này có nghĩa là người dùng không nhất thiết phải bắt đầu từ một prompt trống, mà có thể dựa trên các tài liệu hiện có để tiếp tục chỉnh sửa: thay đổi nền, thay đổi phong cách, thay thế các yếu tố, thậm chí kết hợp nội dung thực tế với hình ảnh do AI tạo ra.

  • Nếu bạn muốn tạo video, Seedance hiện nay mạnh hơn.

  • Nếu bạn muốn chỉnh sửa video, hướng đi của Omni có nhiều tiềm năng hơn.

Giai đoạn tiếp theo của video AI có thể không chỉ là “tạo một đoạn video”, mà còn cho phép AI chỉnh sửa video giống như hình ảnh.

Từ góc độ này, Seedance đại diện cho khả năng tạo sinh chín muồi hơn hiện nay, trong khi Omni giống như đang khám phá quy trình biên tập video trong tương lai.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.