Автор: Чжэн Минфан
Источник: Волл-стрит обзор
Когда OpenAI на другой стороне океана, кажется, нажала «паузу» для AI-генерирующей модели Sora, китайские технологические гиганты начали контрнаступление в этой области.
Недавно компания ByteDance запустила новую версию модели генерации видео Seedance 2.0, которая быстро взорвала интернет благодаря своим преимуществам, таким как многосигнальный ввод, автоматическая съемка и согласованность.
Основатель Game Science Фэн Цзи после глубокого опыта дал очень значимую оценку: «В области контента обязательно произойдет беспрецедентная инфляция».
Пророчество Фэн Цзи не является напрасными тревогами.
Эта ударная волна быстро достигает таких отраслей, как электронная коммерция, игры, видео-платформы, производство фильмов и сериалов: в сфере электронной коммерции технические барьеры низкоуровневых подрядчиков и баз съемок полностью уничтожены; в игровой индустрии цикл производства проверки концепции и материалов для покупки трафика сжат до предела, конкуренция становится еще более жесткой; видео-платформы вынуждены дополнительно оптимизировать логику распространения, чтобы справиться с резким ростом предложения; а традиционный линейный процесс «съемки + монтаж» в киноиндустрии сталкивается с угрозой снижения размерности из-за промышленной трубки «подсказки + генерация».
Большая индустриальная перестройка, связанная с выгодами и заменой, уже началась.
Экспансия производственных мощностей видео
В прошлом году самой большой проблемой в области видеосъемки с помощью ИИ была доставка.
Независимо от того, Sora, Runway, отечественные Keling, а также Jiemeng, разработанный самим ByteDance, у всех есть такие проблемы. Креаторы часто глубоко погружаются в игру в стиле «вытягивания карт», чтобы получить несколько секунд видео без сбоя и с последовательностью, им приходится повторно генерировать его десятки раз.
Ключевым прорывом Seedance 2.0 стало стремление превратить «фокусы» в «прикладные истории».
Основные прорывы в ключевых компетенциях проявляются в трёх аспектах:
Первое — многомодальное ввод. По данным AllTech, при первом входе, подписчики платформы Ji Meng могут использовать Seedance 2.0, заплатив всего 1 юань за автоматическое продление. Он поддерживает текст, изображения, видео и аудио в качестве материалов для ввода, можно сказать, что почти все форматы, которые вы можете себе представить, можно ввести для генерации видео.
Во-вторых, понимание сюжета и самостоятельное управление кадрированием. Seedance 2.0 демонстрирует «режиссерское» мышление, оно не только понимает сложную логику повествования, но и автоматически управляет языком кинематографа, выполняя операции с кадрированием, такие как приближение, удаление, повороты и перемещение. Видео больше не является простым смещением статических изображений, а обладает логикой повествования, напоминающей кино.
Третий - это целостность изображения. По данным тестов All-Weather Technology, на рынке различных приложений по генерации видео с помощью ИИ, во время движения основного объекта, проблема разрушения выражения лица и появление четкости и размытости в фоне возникает снова и снова.
Но посмотрев демонстрационное видео, можно заметить, что Seedance 2.0 сохраняет целостность информации о лице, кадре и т.д. в процессе движения объекта, что делает возможным последовательное повествование.
Это означает, что генерация видео с помощью ИИ превращается из игрушки в инструмент. Возможность превращения генерации видео в стандартизированную промышленную трубу делает пустой фразой «каждый может быть режиссером», что также значительно сократит затраты на производство видео.
Фэн Цзы использовал выражение «инфляция», чтобы описать эти изменения.
«Производственные издержки при создании общих видеороликов больше не будут следовать традиционной логике кинематографической индустрии, а начнут постепенно приближаться к предельным издержкам вычислительной мощности. В сфере контента неизбежно наступит беспрецедентная инфляция, а традиционная организационная структура и производственные процессы будут полностью перестроены. Уверен, что все, кто уже пользовался этим, быстро поймут, что это предсказание вовсе не杞人忧天.» — заявил Фэн Цзи.
Первая волна удара
Когда предельные издержки производства видео приближаются к нулю, бизнес-модели, основанные на старых структурах издержек, будут первыми подвергнуты нападению.
Электронная коммерция, игры, видеоплатформы и индустрия создания фильмов, вероятно, являются первыми отраслями, которые пострадают.
Самые прямые ощущения от землетрясения впервую очередь проявились в сфере электронной коммерции.
Презентация товаров, сценическое исполнение и видеоролики с описанием функций по своей сути не зависят от сложного художественного повествования, а заключаются в четкой передаче информации.
С популяризацией Seedance 2.0, порог доступа к видеосъемке для предпринимателей был полностью снят. Низкосортные компании по видео-аутсорсингу, а также площадки для съемок на Taobao, которые раньше выживали за счет «разницы информации» и «технических барьеров», столкнутся с тяжелыми временами. Создание видео может перейти от профессионального аутсорсинга к повседневной деятельности предпринимателей.
По сравнению с электронной коммерцией, влияние моделей генерации видео с помощью ИИ на игровую индустрию может быть относительно ограничено, но революция уже началась.
Стоимость создания демонстрационных мировоззрений, проверки концепций и рекламных видеороликов для привлечения клиентов снижается экспоненциально. Более того, проекты будут проверяться на более ранних этапах, а также будут отсеиваться на более ранних этапах.
Источник в игровой компании в Пекине сообщил TechWeb, что компания уже начала небольшие испытания Seedance 2.0.
Модели генерации видео с ИИ также меняют логику распространения видео на платформах.
Для платформ вроде Douyin и Kuaishou видео, генерируемые с помощью моделей вроде Seedance 2.0, приводят к взрывному росту объема контента, что заставляет платформы полностью перенести свое ядро конкуренции на механизм «отбора и распространения», например, чей алгоритм может точнее выявлять золото из огромного количества контента, сгенерированного ИИ, и чья коммерческая эффективность выше, тот и победитель.
В киноискусстве, мультикамерная повествовательная способность Seedance 2.0 может изменить производственный процесс.
Ранее создание одного фильма или телевизионного шоу обычно следовало строгому линейному промышленному процессу: сначала снималось огромное количество материала, а затем монтажер в студии позже делал выборку, соединял фрагменты и строил логику повествования.
Но в логике Seedance 2.0 эта граница становится размытой.
На этапе съемки, в будущем, декорации могут быть сгенерированы с низкими затратами с помощью модели ИИ; сама модель обладает пониманием движения камеры и ритма повествования, и на самом деле уже синхронно завершает работу по «монтажу» в момент генерации видео.
Искусственный интеллект больше не просто выдает отдельные кадры, а напрямую передает готовые фильмы с последовательными пространственно-временными отношениями.
Это означает, что в традиционном производстве фильмов, этап после съемок, который занимает много времени, сталкивается с риском быть уничтоженным алгоритмами.
Будущий поток создания может больше не быть «съемка + монтаж», а стать «подсказка + генерация», функции монтажера претерпят трансформацию с «оператора» в «инженера команд» или «эксперта по эстетике».
Хотя видео, генерируемые текущей версией Seedance 2.0, не идеальны на 100%, логические детали, кадры и т.д. всё ещё требуют улучшения, но на фоне того, что скорость технических итераций намного превышает ожидания рынка, эти проблемы в недалёком будущем не будут препятствием.
«Ров» для IP
Замечательная способность Seedance 2.0 к «ремейку» вызывает ощущение удовольствия от творчества у обычных людей, но также вызывает беспрецедентное давление на правообладателей.
Недавно на платформе коротких видео вирусно распространились различные «вторичные» и даже «пародийные» фрагменты из классических фильмов Чоу Сянчжи.
С поддержкой вычислительной мощности моделей генерации видео с ИИ, лицо Чоу Сянчжи, его характерный смех и даже классический стиль реплик были дешево воспроизведены множеством пользователей, а также сгенерировано множество нелепых сюжетов, которые никогда не происходили.
Это быстро привлекло внимание команды Чоу Сянчжи.
Чжоу Сянъи агент Чэнь Чжэньюй публично выступил с вопросом: «Хочу спросить, относится ли это к нарушению прав (особенно в последние два дня массовое распространение), я думаю, что авторы уже получили прибыль, а определенная платформа не будет ли она сознательно игнорировать и предоставлять пользователям возможность генерировать и публиковать?»
Это обвинение, на первый взгляд, раскрывает тревогу по поводу авторских прав в эпоху искусственного интеллекта, но с точки зрения коммерческой логики, наоборот, доказывает крайнюю дефицитность топовых IP в эпоху искусственного интеллекта.
В будущем, когда поток AI-сгенерированного контента будет избыточным, само по себе технологическое преимущество перестанет быть барьером, потому что у всех будет одинаковый инструмент Seedance 2.0.
Настоящие барьеры все еще находятся в руках владельцев авторских прав.
Именно из-за того, что на рынке полно подделок, очень похожих на Чоу Ссин-чи, становится еще более очевидной незаменимость настоящего IP Чоу Ссин-чи.
Когда предложение контента не только избыточно, но и "инфлиционно", время и внимание пользователей станут более ценимыми, чем раньше. Тем не менее, мгновенно привлекать внимание пользователей могут все еще классические IP, проверенные временем и обладающие сильной эмоциональной проницательностью.
Другими словами, искусственный интеллект, снизив порог входа в производство, неограниченно повысил ценность «узнаваемости».
Перспективы для владельцев интеллектуальной собственности остаются светлыми. Интеллектуальные активы, накопленные годами, больше не будут просто объектами нарушения прав, но смогут достичь экспоненциального увеличения коммерческой ценности через лицензирование оригинальных прав на искусственный интеллект через руки бесчисленных создателей.
С момента запуска в феврале 2024 года Sora 1.0 от OpenAI, который стал первым в мире моделью искусственного интеллекта, поддерживающей генерацию видео продолжительностью до 60 секунд, до сегодняшнего дня, когда компания ByteDance представила Seedance 2.0, способный генерировать полноценные 60-секундные повествовательные фильмы с сопровождением собственного аудио на основе многомодальной входной информации, прошло всего 2 года.
В эпоху стремительного технологического развития все отрасли находятся на перепутье: затраты на исполнение сокращаются до бесконечно малых величин, а профессии, основанные на рутине, количестве рабочих и времени, будут беспощадно заменены; одновременно с этим ценность интеллектуальной собственности и творчества становится бесконечно большой.
Когда инструменты станут доступны, то, что определит высоту содержания, больше не будет зависеть от умения пользоваться программным обеспечением, а от того, насколько уникальна идея о мире в вашей голове.
