Интеллект начинает расти нелинейно, основная логика AI-компаний переписывается.
Автор статьи, источник: GeekPark
90% — такова вероятность провала стартапов в области ИИ по оценке инвесторов на 2026 год.
В апреле платформа для оценки ИИ-моделей Yupp, получившая семя-финансирование в размере 33 миллионов долларов США под руководством a16z, неожиданно объявила о закрытии. Платформа, которая пользовалась поддержкой таких видных деятелей из Кремниевой долины, как главный научный сотрудник Google Джефф Дин и сооснователь Twitter Биз Стоун, привлекла 1,3 миллиона пользователей менее чем за год, но внезапно была остановлена основателями. Несмотря на значительные денежные средства на балансе, основатели уже не видели перспектив. «Только за последний год структура возможностей ИИ-моделей кардинально изменилась; в будущем речь будет идти не только о моделях, а об агентных системах», — написал основатель Yupp Панкадж Гупта в посте прощания.
В тот же период компания по созданию AI-изображений NeuroPixel закрылась из-за резкого повышения возможностей крупных моделей, таких как Google NanoBanana Pro. Основатель NeuroPixel использовал одно слово, чтобы описать это поражение: outgunned — «разбитый без возможности сопротивляться за одну ночь».
На фоне интеллектуального скачкообразного улучшения базовых моделей границы возможностей ИИ постоянно расширяются: сначала чат-боты вытеснили поисковые системы, и пользователям больше не нужно пролистывать страницы в поиске результатов. Затем агенты начали вытеснять программное обеспечение — интеллектуальный агент, способный вызывать инструменты и разбивать задачи, может выполнять то, что раньше требовало целого набора меню и приложений. Когда ИИ может напрямую писать код, вызывать интерфейсы и выполнять действия на терминале, границы традиционных программных систем также переопределяются.
Для продуктовых менеджеров важно пересмотреть форму продукта и способы взаимодействия. Для основателей же перед лицом вопрос, определяющий выживание:
Когда интеллект базовых моделей становится все сильнее, как мне начать свой бизнес? Как я могу убедиться, что то, чем я сейчас занимаюсь, не будет полностью поглощено следующим обновлением модели?
Основатель FlashLabs Ши И жив в этом вопросе уже год. Он принял ряд решений, которые кажутся внешним наблюдателям крайне неинтуитивными: отменил дорожную карту продукта, сознательно сократил команду, отказался от краткосрочных коммерческих показателей и даже сменил название компании. Мы поговорили с ним о том, как стартапам в области узкоспециализированного ИИ выжить в эпоху эволюции универсальных моделей.
01 Переименование, оптимизация, переход на нативные ИИ-решения: жизненно важная трансформация, вынужденная крупными моделями
Чувство кризиса не появилось у основателя сегодня. Еще в конце 2024 года Ши И осознал, что интеллектуальное развитие универсальных моделей происходит слишком быстро.
Первым признаком аномалии, который он заметил, стало исчезновение AI-уникорна Jasper. Эта звездная компания, ранее считавшаяся эталоном в области приложений ИИ, за 18 месяцев достигла оценки в 1,5 млрд долларов, но после открытия встроенных возможностей GPT ее выручка сократилась вдвое. «ARR Jasper напрямую сократился вдвое,» вспоминает Ши И, «все компании, занимавшиеся NLP, по мере роста возможностей крупных моделей будут поглощены ими.»
Это суждение, как шип, вонзилось в его сердце, вызывая скрытую тревогу. В то время его компания еще называлась FlashIntel и занималась относительно традиционным B2B SaaS-бизнесом. Согласно традиционной логике B2B SaaS, если вы накапливаете достаточное количество отраслевых данных в достаточно узкой нише и строите технологические барьеры с соблюдением нормативных требований и безопасности, то у вас обязательно найдется рыночное пространство для выживания — но теперь все это уже не работает.
«Не столкнусь ли я с той же самой проблемой, что и я делаю?» — этот вопрос начал повторяться в его мыслях. Он быстро осознал, что его работа по сути ничем не отличается от работы Jasper: все прежние продукты были построены на предположении, что модель не превзойдет специализированные модели. Как только базовая модель достигнет определенного порога интеллекта, все инженерные решения и оптимизации сценариев, накладываемые на специализированные продукты, могут за одну ночь потерять всякое преимущество.
Получив вывод, он сразу выдвинул этот ключевой вопрос на первый план корпоративной стратегии, вынуждая команду принять решение: компания должна полностью перейти от SaaS к AI Native.
Это изменение не произошло мгновенно. Его первым вопросом было: какая организационная структура необходима следующему поколению AI-компаний?
Он считает, что сейчас ведение бизнеса уже не должно ориентироваться на количество сотрудников и детальное разделение обязанностей. «В эпоху ИИ чем больше людей, тем хуже они используют ИИ, потому что чем тоньше разделение обязанностей, тем больше каждый зависит только от своей узкой области». Он начал сознательно сокращать команду и полностью сместить критерии найма с «опыт и проекты» на «способ мышления и полный стек навыков». Методы оценки кандидатов тоже изменились: он больше не смотрит на прошлые резюме или опыт, а сразу дает кандидатам задачи, чтобы проверить, сможет ли человек с помощью ИИ полностью справиться с фронтендом и бэкендом. «Тот, кто справится, обязательно хорошо использует инструменты ИИ».
Затем он перераспределил приоритеты внутренних ресурсов компании. Пока большинство стартапов сосредоточены на скорости вывода продукта на рынок и подтверждении коммерческой жизнеспособности, он решил направить большую часть ресурсов на передовые исследования и даже изменил название компании на FlashLabs.
«Раньше логика интернета заключалась в приоритете продукта или операций, но сейчас, занимаясь ИИ, нужно ставить на первое место исследования». Он требует от себя и своей команды читать научные статьи и понимать первоначальные принципы: «Только приближаясь к первоначальным принципам, вы сможете понять, что еще сможет сделать ИИ в будущем и что еще сможет заменить».
Этот переход также принес «период боли» внутри компании: не все в команде могли понять это масштабное структурное изменение. Когда он говорил команде: «Сначала не думайте о монетизации, делайте крутые вещи», некоторые внутри компании были в восторге, а другие выбрали уход. Но он настаивал, что в эпоху ИИ важнее упрощение: «Если ты этого не принимаешь, то тебя просто убирают».
Но что еще важнее, какие именно основатели смогут выжить в эпоху ИИ?
Ответ Ши И разделён на две части: первая обращена к реальности — «По крайней мере, ты можешь привлечь деньги, если не умрёшь или у тебя достаточно глубокий карман, чтобы постоянно подпитывать проект». Вторая часть — то, что он действительно хотел сказать: «У тебя есть способность глубокого мышления, превосходящая ИИ?»
«Почему большие модели могут делать всё больше задач? Потому что суть всех естественных наук — математика, а модели умеют писать код и разбираются в математике. Продвигаясь по этой цепочке шаг за шагом, единственная по-настоящему редкая способность человека, которая остаётся, — это мыслить глубже, чем ИИ, в какой-либо конкретной области», — анализирует Ши И. «Многие просто недостаточно хорошо понимают ИИ. Посмотрите, сколько основателей действительно пишут код сами и ежедневно используют инструменты ИИ? Способность писать код в будущем станет товаром массового потребления — каждый сможет это делать. Но сможете ли вы быть умнее ИИ? Именно это и есть ваше конкурентное преимущество».
От осознания кризиса до принятия решения и оплаты цены за реструктуризацию организации, Ши И потратил год на «самообновление». Он не стал ждать обновления модели, чтобы узнать итоговый результат, а выбрал заранее найти место, где может появиться правильный ответ. То, правильно ли он занял это место — вопрос другой, но сейчас он пока не хочет покидать игровой стол ИИ.
02 Корпоративный агент должен сыграть карту «Harness»
Реорганизация структуры — это лишь первый шаг на пути выживания компании. То, что заставило Ши И принять решение о перемене, — это стратегия продукта.
Сначала он хотел создать систему взаимодействия нескольких агентов, следуя логике «силы в численности», и смоделировать организационную структуру человеческой компании, построив систему из нескольких агентов: одни отвечают за поиск, другие — за логические рассуждения, третьи — за сбор и обобщение результатов.
Но реальные результаты заставили Ши И покачать головой: «Слишком медленно, слишком тормозит, и результаты даже хуже, чем у отдельного агента». По его мнению, передача команд между агентами похожа на игру в плохой телефон, где каждый дополнительный этап передачи снижает качество информации. «Я предпочту одного гения с IQ 150 и полным комплектом божественного снаряжения, чем кучу посредственности с IQ 110, вооружённых неполными инструментами и вынужденных постоянно договариваться друг с другом», — прямо заявил Ши И в интервью.
В итоге он отказался от всех предустановленных суб-агентов и решил создать один мощный агент, заменив кластерное взаимодействие параллельным выполнением в нескольких потоках.
Это также прототип последнего продукта FlashLabs — Super Agent, который доводит интеллект отдельной модели и набор инструментов до предела. Super Agent в основном использует интеллектуальную автоматизацию для унификации системы доходов пользователя, от привлечения потенциальных клиентов до заключения сделки, с участием AI Agent на всех этапах.
На интервью в Geek Park Ши И дал Super Agent задачу по поиску информации: «Найдите фоновые данные основателей всех китайских AI-компаний, получивших инвестиции за последние полгода, и выведите результат в виде таблицы». После этого Super Agent одновременно запустил десятки потоков задач, выполняя поиск, веб-скрапинг, написание кода и очистку данных — результат был получен за 2–3 минуты: таблица содержала имена основателей, объем финансирования и публичные контактные данные.
Если отказ от мультиагента — это вычитание на уровне архитектуры, то отказ от локализации — это обратный выбор в логике развертывания.
Когда OpenClaw вызвала «локальный агент» бум в сообществе разработчиков, Ши И не колеблясь разместил Super Agent в облаке. «Если система, подобная OpenClaw, работает внутри корпорации, это эквивалентно троянскому коню — вы легко можете быть взломаны через нее». Он считает, что любая компания, которая сейчас решится на масштабное развертывание OpenClaw внутри своей организации, открывает двери для хакеров по всему миру.
По его мнению, преимущество OpenClaw заключается в том, что на пользовательском уровне проявляется потенциал инициативности. Например, с OpenClaw AI просит у пользователя 2000 долларов на покупку видеокарты, а пользователь отвечает: «Заработай сам» — и AI начинает прогнозировать рынок и изучать количественные стратегии. «Какой босс не любит инициативных сотрудников?» — спрашивает Ши И. Когда такая инициативность станет частью корпоративного продукта, замена человеческих сотрудников произойдет намного быстрее, чем ожидалось. «Раньше, во время промышленной революции, когда кареты заменили автомобилями, нужно было сначала купить автомобиль, получить водительские права, модернизировать дороги — и это занимало много времени. На этот раз все иначе: при развертывании как управляемой услуги — хлопок — и работа десятков сотрудников исчезает». Он также предполагает, что в этом году работа офисных сотрудников будет значительно заменена ИИ.
Что касается сложностей автоматизированного выполнения — а именно, как обеспечить безопасность корпоративных приложений — решение FlashLabs заключается в создании системы разрешений, подобной沙боксной системе macOS, с развертыванием в облаке и постепенной авторизацией. Это означает, что изначально Agent имеет только минимальные права, необходимые для выполнения задачи, а его границы расширяются постепенно после многократной проверки стабильности и безопасности.
Он привёл в пример Windows и Mac: «На Windows установка программного обеспечения может предоставить очень высокие права — тихая установка, интеграция с браузером, что делает удаление практически невозможным. Программы на Mac полностью изолированы в песочнице, поэтому вам никогда не нужно устанавливать антивирус». Ши И считает, что конкуренция на уровне корпоративных агентов в конечном итоге перейдёт от способности вызова моделей к способности проектирования среды: тот, кто сможет предоставить агенту безопасную, контролируемую и аудитируемую среду выполнения, сможет заставить клиентов действительно доверять ему.
Но если модель снова сделает скачок, имеют ли смысл сегодняшние корректировки? Если GPT-6 или Claude будут встроены с более мощными возможностями разбиения задач и вызова инструментов, не будет ли всё, что сегодня делает FlashLabs, снова поглощено?
На этот вопрос Си И не уклонился, его размышления разделились на две стороны.
Он первоначально классифицировал корпоративные барьеры для нишевых компаний на четыре уровня: восприятие (Perception), планирование (Planning), рекурсивное обучение (Recursive Learning), управление (Governance).
На рынке крупных моделей существует пять компаний, и рейтинг SOTA меняется каждые три месяца. С помощью слоя оркестрации вы можете интегрировать все модели и вызывать наиболее подходящую для каждой конкретной задачи. Однако компания, использующая только одну модель, ограничена ею самой — если ваша базовая модель не является самой умной, конкурентоспособность вашего продукта сразу снижается. По мере того как универсальные крупные модели быстро охватывают первые два уровня, Ши И считает, что настоящими барьерами остаются только два последних уровня, а окончательным преимуществом становится слой оркестрации.
Он считает, что когда несколько агентов взаимодействуют в корпоративных системах, они могут тайно договариваться в местах, недоступных для человека, обходя заданные правила доступа. Настоящим барьером для нишевых компаний является способность создавать открытую, но контролируемую среду работы, адаптированную под конкретные сценарии.
Что касается правильности этого суждения, он честно признал, что не уверен на 100%. «ИИ меняется слишком быстро, и вы действительно не знаете, что будет в будущем». Однако он уверен в одном: если вертикальные компании правильно используют стратегии по настройке ИИ и управлению ИИ, а также решат проблемы проектирования среды, они по крайней мере не будут выброшены с игры при следующем скачке моделей.
03-й голосовой моделью ожидается перестройка, активные агенты могут породить новую модель оплаты по результатам
Зная, как создать конкурентоспособный продукт, следующим шагом является получение признания клиентов.
На текущем этапе Flashlabs имеет два основных коммерческих продукта: Super Agent оплачивается по объему использования токенов, цены указаны на официальном сайте; во-вторых, они открыли исходный код своей голосовой модели Chroma, но взимают плату за платформу и сервисы, основанные на этой модели. На самом деле, оба этих подхода являются распространенными сегодня стратегиями монетизации: использование открытого кода для формирования технического доверия и монетизация через платформу и сервисы.
В настоящее время японские налоговые и бухгалтерские компании заменяют живых сотрудников службы поддержки на голосовую модель Chroma от FlashLabs; в настоящее время тестирование проводится с использованием 1/10 от общего числа сотрудников, при этом ИИ и люди работают одновременно, и их производительность постоянно сравнивается по оценкам. Метод проверки прост: кто показывает более высокую точность и лучшую эффективность обработки — тот побеждает, данные говорят сами за себя.
«Границы использования голоса находятся на том же уровне, что и визуальные данные» — пока вся отрасль сосредоточена на мультимодальности и понимании видео, Ши И с командой сосредоточились на разработке модели реального времени Chroma, сократив общую задержку до 135 миллисекунд.
До появления крупных языковых моделей существовали OCR, NLP и различные мелкие модели, скомпонованные вместе. Сейчас голосовая технология находится в том же состоянии, что и текстовые технологии до появления крупных языковых моделей: есть ASR, TTS, различные модули, скомпонованные вместе, и каждый этап проводит локальную оптимизацию. Эта старая архитектура неизбежно будет полностью заменена единой конечной голосовой большой моделью. Его вывод заключается в том, что вместо того чтобы ждать, пока кто-то другой это сделает, лучше самому стать тем, кто заменит её.
Ши И считает, что речь — это наиболее естественный режим общения между людьми, и в будущем она обязательно станет основной интерфейсной формой взаимодействия между людьми и ИИ. «Объем информации, передаваемой с помощью речи, намного больше, чем с помощью текста: я произношу одно предложение, и вы сразу понимаете».
Он также считает, что речевые модели играют ключевую роль в развитии отрасли встраиваемого интеллекта. Первый уровень — это речевые модели в реальном времени, отвечающие за низкую задержку и эмоционально осознанные мгновенные ответы — например, ответы на вопросы о погоде или о том, стоит ли надеть больше одежды; этот уровень обрабатывает запросы напрямую. Второй уровень — это крупные модели глубокого мышления, выполняющие сложные рассуждения. Третий уровень — это модель мира, понимающая физические законы. «Границы использования речи находятся на том же уровне, что и визуальные данные». Это один из его самых уверенных долгосрочных выводов на данный момент.
Ши И также считает, что текущая модель коммерциализации ИИ является лишь переходной. Поскольку все агенты сегодня по сути являются пассивными и реагируют только на команды: вы говорите им, что делать, и они это выполняют, подобно инструменту, ожидающему указаний, и по-прежнему напоминают чат-ботов, поэтому бизнес-модель по-прежнему основана на оплате за потребление токенов — сколько использовал, столько и заплатил.
Но когда агент начинает предоставлять активные услуги — то есть, когда вы сообщаете ему, что такое KPI и что такое OKR, и он сам находит задачи, планирует путь и доставляет измеримые результаты — тогда он перестает быть инструментом и становится сотрудником. Очевидно, компания не оплачивает сотрудника за количество набранных им символов или отправленных им писем; вы смотрите на то, какие цели он выполнил.
Поэтому он считает, что в эпоху агентов бизнес-модель оплаты должна перейти на оплату по результатам и по KPI. Когда этот переход действительно произойдет, вся система ценообразования, методы продаж и отношения с клиентами для агентских продуктов будут переписаны.
Новые бизнес-модели уже начинают внедряться в самой отрасли. Например, AI-юридическая фирма Crosby, недавно получившая 60 миллионов долларов США в рамках раунда B, поручает каждому агенту выполнять отдельные этапы проверки контрактов — такие как извлечение контекстной информации, предложение изменений и создание комментариев — после чего юристы проверяют результаты работы ИИ, устраняют упущенные детали и обеспечивают точность. Их бизнес-модель основана на оплате за количество проверенных контрактов: от 250 до 1000 долларов США за каждый, в зависимости от количества страниц, примерно по 10–50 долларов США за страницу.
Но настоящим условием перехода к следующей коммерческой модели является способность активных агентов стабильно доставлять измеримые результаты. «Сейчас мы еще не дошли до этого этапа.»
От FlashIntel до FlashLabs Ши И с помощью一年 времени провел четко обозначенную реструктуризацию и корректировку стратегии. Сокращения, отказ от существующей архитектуры продукта, временное замедление коммерциализации — все эти действия со стороны выглядели как постоянное упрощение.
Но в реальности быстрой итерации индустрии ИИ это больше похоже на самоориентацию стартапа в условиях резких изменений. Способности моделей могут значительно улучшаться каждые несколько месяцев, и никто не может полностью предсказать будущее. Для Ши И и FlashLabs на данном этапе ключевым является не захват как можно большей доли рынка, а максимально обеспечить, чтобы их технологические решения и бизнес-логика не были легко вытеснены следующей волной.
Индустрия все еще исследует истинную форму агентов; модели оплаты, безопасные границы и конечные формы взаимодействия еще не определены. Выбор FlashLabs, возможно, не является наилучшим решением, но он представляет собой реальный путь выживания для вертикальных ИИ-компаний: под давлением постоянного проникновения крупных моделей сначала найти устойчивую позицию, а затем ждать, пока отрасль действительно созреет.
