Android, iOS, HarmonyOS и Windows входят в эру агентов с интеграцией ИИ на уровне ОС

icon MarsBit
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Новости об ИИ и криптовалюте показывают, что основные игроки в области ОС продвигают интеграцию агентов на системном уровне. Google, Apple, Microsoft и Huawei теперь предлагают платформы с встроенным ИИ, включая Gemini Intelligence, Foundation Models, Copilot+PC и HarmonyOS 6 с HMAF. Эти системы поддерживают кросс-прикладную автоматизацию и улучшенную конфиденциальность. Основные компоненты включают AI Runtime, управляемые чипы и матрицы моделей «конец-облако». Новости о криптовалюте подчеркивают, как более глубокая интеграция ИИ меняет конкуренцию среди ОС.

Статья | Yunyong AI, автор | Хуан Юньхао

. После Google I/O 2026: четыре основные ОС на стороне устройства входят в эпоху агентов

12 мая 2026 года Google провела презентацию Android Show | I/O Edition — отдельное мероприятие по Android перед I/O-конференцией 19 мая. Президент экосистемы Android Самер Самат задал тон этой презентации: Android должен превратиться из операционной системы в интеллектуальную систему. Основой для этого направления стала Gemini Intelligence — набор активных возможностей ИИ на уровне системы Android.

Виндовс

2026 год, Android Show | Постер презентации I/O Edition
Источник: Android Heaadlines

По сравнению с комбинацией Gemini Nano + AICore прошлого года, Google теперь глубже интегрировал возможность агента работать через приложения и контекст на уровне ОС: автоматизация задач между приложениями (заказ еды, покупки, оформление заказов), автоматическое заполнение форм, аннотирование веб-страниц, настраиваемые виджеты — всё это постепенно включено в список системных возможностей. Google также выделил три основных принципа продукта: явный контроль пользователя (explicit user control), всесторонняя защита данных (comprehensive data protection) и операционная прозрачность (operational transparency).

На тематической презентации I/O 19 мая, через неделю, генеральный директор Google Сундар Пичай начал с этой основной идеи:

Добро пожаловать в эру агентного Gemini(欢迎进入Agent化的Gemini时代)

Участвуя в волне перехода к OS-агентам на краю, Google не был одним из первых.

Microsoft представила Copilot+ PC на событии Build 2024 в мае 2024 года (новая линейка устройств с Windows 11 с NPU мощностью более 40 TOPS), интегрировав возможности агента в операционную систему на основе трех функций: небольших моделей на устройстве Phi Silica, функции экранного агента Click to Do и системной памяти активности Recall.

На WWDC24 в июне 2024 года Apple официально объявила о «Apple Intelligence», позиционируя её как «персональную интеллектуальную систему». Позже были постепенно запущены некоторые функции с поддержкой ИИ, однако из-за проблем с разработкой собственной крупной модели и слабой работой Siri основные возможности агента Apple Intelligence так и не были реализованы.

Huawei выпустила HarmonyOS 6 и фреймворк интеллектуальных агентов HarmonyOS (HMAF) на HDC 2025 в июне 2025 года, после чего на платформе Xiao Yi Intelligence Agent Plaza было представлено более 80 интеллектуальных агентов.

Крупный тренд на агентизацию ОС на стороне устройства уже наблюдается в таких основных операционных системах, как Android, iOS, HarmonyOS и Windows.

На презентации демонстрировались только функции; то, во что действительно играют производители ОС, — это три уровня базовых возможностей, обеспечивающих надежную работу OS Agent и реальное решение проблем: системный AI Runtime, управляемые чипы и матрица моделей «конец-облако».

二. Под анонсом: три слоя основы, поддерживающие OS Agent

Системный AI-рантайм: центр управления интеллектом на стороне устройства

Runtime — это инференс-движок и системные службы, на которых работают модели на стороне устройства. Снизу он напрямую взаимодействует с NPU и планировщиком системных ресурсов; сверху он предоставляет стабильные API для экспозиции возможностей инференса всем приложениям. Он превращает модели на стороне устройства в «общий интеллект на уровне ОС»: совместное использование весов моделей между приложениями, унифицированное планирование вычислительных мощностей и памяти, поддержка вызовов инструментов, необходимых агентам, управление генерацией, а также интеграция контекста и прав доступа. Он определяет, будет ли OS Agent просто кнопкой чата внутри приложения или постоянной службой на уровне операционной системы, способной выполнять системные операции.

Самым полным образцом в экосистеме Android является Google AICore. В декабре 2023 года AICore был запущен как системная служба (system service) в Android 14; в августе 2025 года Gemini Nano стал доступен разработчикам через ML Kit GenAI APIs. От системной базы до стабильных API для приложений AICore прошел почти два года постоянной доработки.

Другие производители ОС идут тем же путем, но с разным темпом. Apple открыла для разработчиков фреймворк Foundation Models на WWDC25, который включает в себя декоратор @Generable, вызов инструментов, управляемую генерацию и состоятельные сессии, при этом за кулисами работает локальная базовая модель с примерно 3 млрд параметров, поддерживаемая облачными вычислениями с обеспечением конфиденциальности. Microsoft интегрировала фреймворк Foundry on Windows и Phi Silica в Windows 11, используя Windows ML в качестве нижележащего бэкенда для вывода. Huawei на HDC 2025 представила Agent Framework Kit (фреймворк агентов HarmonyOS, HMAF), открыв систему намерений и протокол взаимодействия агентов.

Виндовс

Android AICore как системная служба управляет выполнением Gemini Nano на аппаратном ускорителе
Источник: Android Developers

Управляемый чип: точка опоры для программно-аппаратного взаимодействия

Google на Android Show|I/O Edition установил четкие аппаратные требования для Gemini Intelligence: полный набор функций будет доступен только на нескольких самых новых флагманах, таких как Pixel 10 и Galaxy S26, а модели прошлого года не входят в список. Это указывает на простой факт: ИИ-модели продолжают быстро развиваться, и программное обеспечение постоянно выдвигает новые требования к аппаратному обеспечению. Управляемые чипы являются основой для выполнения этих требований, и степень управляемости определяет пространство, доступное производителям ОС для адаптации программного и аппаратного обеспечения для агентов ОС на устройстве.

Apple — это эталон подхода, объединяющего программное и аппаратное обеспечение. iOS и macOS с самого начала развивались параллельно с чипами серии A и M, а Core ML объединил управление CPU, GPU и ANE на уровне фреймворка. Этот подход продолжает развиваться в эпоху LLM. Apple Machine Learning Research предоставила ряд реальных измерений: при развертывании Llama 3.1 8B Instruct на M1 Max с использованием оптимизаций Core ML локальная скорость декодирования достигает примерно 33 токенов/с. Технический отчет «Apple Intelligence Foundation Language Models» также раскрывает, что Apple внедрила архитектурные оптимизации, такие как совместное использование KV cache и квантовое обучение с учетом 2-битного квантования, чтобы успешно предоставить разработчикам базовую модель размером около 3B через фреймворк Foundation Models. Такой уровень глубины возможен только тогда, когда компания контролирует собственные чипы — именно в этом заключается ценность контролируемого чипа для производителей ОС: он определяет глубину программно-аппаратной совместимости и повышает потенциал пользовательского опыта для агентов ОС на стороне устройства.

В эпоху ИИ Google делает то же самое — начиная с Pixel 6, он перешел на собственную архитектуру Tensor SoC, а новейший Tensor G5 повышает производительность TPU до 60% и среднюю производительность CPU на 34%, став первым SoC, полностью поддерживающим новейшую версию Gemini Nano, которая будет реализована в Pixel 10. Однако у Tensor G5 есть и недостатки: по результатам тестов Android Central, его объем памяти (RAM) по-прежнему является узким местом для производительности ИИ, а результаты Geekbench AI ниже, чем у Snapdragon 8 Elite; в тестах Geekbench 6 от Macworld одноядерные и многоядерные показатели G5 также ниже, чем у A18 Pro. Google все еще догоняет, но стратегия совместной работы собственного Tensor и Gemini на устройстве уже сформировалась.

Huawei Kirin в сочетании с NPU Da Vinci и моделью Pangu на стороне устройства представляет собой альтернативный путь к контролируемым чипам, параллельный Apple и Google. Xiaomi внедрила Xuanjie O1, став новым участником на пути к контролируемым чипам.

Матрица моделей на конце и в облаке: источник интеллекта агента

Матрица моделей «конец-облако» является источником «интеллекта» для конечных устройств: облачные модели задают потолок возможностей для сложных задач, а локальные модели обеспечивают минимальный порог для повседневной работы — задержка, время автономной работы, конфиденциальность и стабильность лежат на стороне конечного устройства. Обе стороны неразделимы, различие заключается в глубине интеграции с ОС. Локальные модели должны быть встроены в ОС каждого конечного устройства и глубоко интегрированы с локальным NPU, выполняя двойную роль в ОС: внизу — это локальный бэкенд для вывода в Runtime; вверху — через фреймворк и SDK Runtime они предоставляются приложениям в виде системных API.

Собственная разработка имеет значение как в облаке, так и на краю, но отдача на краю более очевидна. Модели, закупаемые извне для облака, могут обеспечить потолок возможностей, тогда как преимущества собственной разработки в основном проявляются в контроле над маршрутизацией, коммерческих условиях и темпе итераций модели. С краем иначе. Модели на краю встраиваются в ОС и NPU каждой устройства, и отдача от собственной разработки напрямую проявляется в производительности продукта: совместное использование KV cache, 2-битное квантование с учетом обучения, специально разработанное для определенного поколения чипов, Per-Layer Embedding (взято из Gemma 3n, инкрементальная загрузка параметров встраивания по уровням из быстрой памяти) и т.д. — все это удобнее реализовать при одновременной разработке модели и аппаратного обеспечения; в то же время синхронизация темпов не должна больше зависеть от сторонних производителей аппаратного обеспечения.

Производительность TPU Tensor G5 по сравнению с предыдущим поколением G4 увеличена до 60%, но улучшения Gemini Nano на G5 выходят далеко за эти рамки — согласно официальным данным Google и Jon Peddie Research, локальная скорость обработки в 2,6 раза выше, энергопотребление сокращено вдвое, а окно токенов расширено с 12 000 до 32 000 (что эквивалентно обработке примерно ста скриншотов за один раз). Эти значительные превосходящие характеристики обусловлены архитектурой эластичного вывода Matryoshka Transformer, используемой в Gemini Nano v3, в сочетании с совместной оптимизацией с TPU Tensor G5.

Виндовс

Gemini Nano на Tensor G5 — это скачок в производительности по сравнению с предыдущим поколением
Источник: Google/Jon Peddie Research, облако AI-графики

На уровне клиентских моделей крупные производители ОС владеют собственными разработками: Gemini Nano от Google, базовая клиентская модель Apple с примерно 3 млрд параметров, Phi Silica от Microsoft и клиентская модель Паньгу от Huawei. Разработка собственных моделей — это стандартный подход на этом уровне.

Три. Между тремя уровнями: чем глубже сотрудничество, тем больше пространство для дифференциации

Трехуровневая база возможностей, объединенная снизу вверх: управляемый чип → модель на стороне устройства/в облаке → Runtime → Agent. Управляемый чип определяет эффективность вывода и энергопотребление модели на стороне устройства, модель на стороне устройства определяет локальный интеллект, который может быть запланирован Runtime, а Runtime определяет надежность выполнения Agent как системной службы через приложения. Чем глубже взаимодействие между ними, тем больше дифференциация пользовательского опыта производителей ОС в области агентов на стороне устройства и тем шире их конкурентное преимущество.

Чем глубже три уровня интегрированы в одну и ту же программно-аппаратную платформу, тем более выраженные отличительные возможности продукта OS Agent проявляются, недоступные одному уровню.

  • Задержка ответа и энергопотребление. Достижение Gemini Nano в 2,6 раза более высокой скорости обработки и снижении энергопотребления на Tensor G5 обусловлено взаимной адаптацией архитектуры модели, проектирования чипа и планирования Runtime в рамках единой платформы программного и аппаратного обеспечения — именно такое сочетание позволяет достичь подобного уровня улучшений.
  • Приватность и доверие. Задачи, связанные с конфиденциальными данными, выполняются локально на устройстве с помощью моделей на краю, а сложные запросы передаются в облако — это разумная стандартная позиция OS Agent по отношению к данным пользователя на текущем этапе. Три уровня взаимосвязи определяют, сможет ли эта стратегия «приоритет края, облако как резерв» быть реально реализована: глубокая адаптация NPU и моделей на краю — ключевой путь, позволяющий моделям на краю, находящимся на стадии развития, справляться с частыми задачами инференса; квантование и сжатие модели для NPU и совместное использование KV cache; Runtime маршрутизирует задачи между краем и облаком в зависимости от их сложности. Если хотя бы один из трех уровней не будет реализован должным образом, «приоритет края» останется лишь маркетинговым слоганом.
  • На системном уровне производитель ОС重组跨应用 и межуровневые пользовательские данные (семантический индекс, восприятие экрана, долгосрочная память) в системный персональный контекст для агента — это предпосылка для того, чтобы агент по-настоящему «понимал пользователя», и ключевая особенность, отличающая агента ОС от агентов на уровне отдельных приложений. Реализация зависит от трех взаимосвязанных уровней: среда выполнения хранит межприкладные индексы и права, локальная модель постоянно активна для понимания и вывода, а NPU обеспечивает эффективные вычислительные мощности на устройстве. Core Spotlight от Apple создает семантический индекс на терминальном устройстве, приложения интегрируют действия и данные в систему через App Intents, а агент будет получать контекст через Personal Context (Apple уже объявила, что эта функция будет доступна с будущими обновлениями программного обеспечения); Android-сторона AppFunctions следует тому же пути.
  • Надежность как системной службы. OS Agent должен быть доступен в реальных сценариях, таких как отсутствие подключения к интернету, низкий уровень заряда батареи, тепловое снижение частоты и т.д., чтобы вызываться как системная служба. Модели на стороне устройства постоянно работают на устройстве, позволяя Agent функционировать без подключения к сети; высокооптимизированный NPU для аппаратного ускорения с низким энергопотреблением; Runtime при нехватке ресурсов устройства адаптивно переключается (переходит на более легкие модели или перенаправляет запросы в облако). Если хотя бы один из трех уровней отсутствует, OS Agent не сможет выполнять функции системной службы и вернется к виду кнопки чата на уровне приложения.

Apple Intelligence представляет собой полную когерентную парадигму: Apple Silicon, примерно 3 млрд локальных базовых моделей, фреймворк Foundation Models, скрепленный снизу вверх — локальная обработка типичных сценариев, сложные запросы передаются в частное облачное вычисление. Google — это иная форма. Tensor G5, первый SoC, полностью реализующий новейшую версию Gemini Nano, появляется в Pixel 10, с единым управлением от AICore, что позволяет системным агентским функциям, таким как Magic Cue и Pixel Screenshots, работать по умолчанию без зависимости от облачных ресурсов. Huawei является образцом создания трехуровневой координации в Китае: собственные решения — Kirin, Da Vinci NPU, Pangu локальный, HMAF — все четыре компонента объединены в единую трехуровневую платформу снизу вверх.

Виндовс

Трехуровневый механизм зацепления OS-агента на стороне устройства
Источник: CloudYong AI


4.
На фоне фундамента: другие ключевые переменные долгосрочной защитной дамбы

Основу трехуровневой совместной защиты составляют множество переменных, влияющих на конкурентоспособность продуктов эпохи OS Agent, таких как способность взаимодействия агентов с приложениями и защита конфиденциальности.

OS Agent и взаимодействие с приложениями находятся на передовой конкуренции между производителями ОС и производителями приложений. В настоящее время идут два параллельных пути. Один — распознавание экрана и автоматизация, включая Gemini Live с обменом экраном, Apple Visual Intelligence, Circle to Search и т.д. OS Agent взаимодействует с приложениями, считывая экран и нажимая кнопки; это работает для однократных задач, но каждый вызов лишён структурированной информации, а многошаговые действия трудно стабильно организовать в рабочие процессы. Второй путь — глубокая интеграция через API, включая Google AppFunctions, Apple App Intents, Huawei Intents Kit и т.д. Приложения предоставляют системе структурированные интерфейсы для ключевых действий, что позволяет Agent вызывать их стабильно и строить многошаговые рабочие процессы. Возможность масштабирования пути API зависит не от производителей ОС, а от производителей приложений. Передача ключевых функций на вызов Agent означает, что пользователи могут перестать открывать приложения напрямую — это риски потери брендинга, рекламных мест, поведенческих данных и точек оплаты, которые могут быть перехвачены ОС. Это станет ключевым пунктом борьбы за контроль над распределением трафика на конечных устройствах со стороны пользователей.

Защита конфиденциальности — это ключевая ценность и основополагающий принцип встроенных систем. Производители ОС обладают самыми глубокими системными правами и наиболее чувствительными пользовательскими данными на стороне устройства; конфиденциальность является как их основной позицией, так и предварительным условием для долгосрочного продвижения первых двух аспектов. Apple создала систему защиты конфиденциальности на основе терминальных устройств, используя одинаковый аппаратный уровень безопасности, общий между встроенным безопасным модулем Secure Enclave и узлами частного облачного вычисления PCC. Эта продуктовая стратегия превратила «Privacy. That’s Apple.» в ключевую брендовую метку Apple на глобальном рынке премиум-сегмента, обеспечив доверие пользователей.

Виндовс

Ярлык Apple «Конфиденциальность. Это Apple».
Источник: официальный сайт Apple

Основу трехуровневой синергии, формирующей конкурентное преимущество, составляют эти долгосрочные переменные, определяющие, насколько глубоко его можно укрепить.

五. Не только переделка OS

В условиях тенденции к агентизации ОС на стороне устройства, чем прочнее три базовых слоя — системный AI Runtime, управляемые чипы и матрица моделей устройство-облако, тем выше нижний порог продукта для производителей ОС и тем больше пространство для дифференциации. Только производители ОС, которые ухватят эту тенденцию, смогут повлиять на перераспределение трафика на стороне устройства и занять более сильную позицию в конкуренции.

Этот тренд не ограничивается телефонами и ПК. Базовые возможности OS Agent распространяются на другие устройства через уже созданные экосистемы многоустройственных платформ, особенно активно в сфере IoT. Контролируемые чипы внедряются в сценарии, такие как автомобильные SoC: Huawei уже разработала автомобильные чипы Kirin, а Xiaomi PiPeng OS интегрирована в собственные модели автомобилей; модели на стороне устройства адаптируются к новым форм-факторам, таким как очки: смарт-очки Android XR, разработанные в партнерстве Google, Samsung, Gentle Monster и Warby Parker, поступят в продажу осенью 2026 года; взаимодействие Runtime и Agent расширяется через уже реализованные фреймворки «супертерминалов/распределенных систем» на группы устройств — например, Huawei 1+8+N и распределенная мягкая шина HarmonyOS, Xiaomi «полная экосистема человек-автомобиль-дом» и HyperConnect, Apple Continuity, Google Cross-device SDK и межустройственные сервисы. Эта битва за OS Agent выходит далеко за рамки победы или поражения на рынке телефонов и ПК.

AICore дорабатывался почти два года; операционная система Apple и серия чипов Apple Silicon адаптировались друг к другу в течение десятилетий; Tensor прошел множество обновлений до G5, чтобы Pixel 10 смог справляться с Gemini Nano v3. Исход этой битвы никогда не определяется одним-двумя часами на презентации — он вырабатывается поколениями чипов, моделей и Runtime.

Справочные материалы:

  • Gemini Intelligence выводит проактивный ИИ на Android|Блог Google
  • I/O 2026: Добро пожаловать в эру агентного Gemini|Google Blog
  • Phi Silica — маленький, но мощный SLM на устройстве|Windows Experience Blog
  • Apple откладывает обновление Siri на неопределённый срок|Bloomberg
  • Запуск бета-версии разработчика HarmonyOS 6 (HDC 2025) | Huawei
  • Последняя версия Gemini Nano с API ML Kit GenAI на устройстве|Блог разработчиков Android
  • Документация фреймворка Foundation Models|Apple Developer
  • Белая книга фреймворка хармони-интеллектуальных агентов | Разработчики Huawei
  • Llama 3.1 на устройстве с использованием Core ML|Apple Machine Learning Research
  • Технический отчет 2025 года по базовым языковым моделям Apple Intelligence|Исследования машинного обучения Apple
  • Google Tensor G5: Результаты тестов и всё, что вам нужно знать|Android Central
  • Новый M5 SoC от Google (Tensor G5: подробный разбор · Matryoshka Transformer) | Jon Peddie Research
  • Вычисления в частном облаке: Новая граница для конфиденциальности ИИ в облаке|Apple Security Engineering
  • Обзор AppFunctions|Android Developers
  • Приложения Intent|Apple Developer
  • Краткое описание Intents Kit (HarmonyOS) | Разработчик Huawei
  • Чип Tensor G5 в Google Pixel 10 Pro впечатляет — если сравнивать его с iPhone 14|Macworld
  • Обзор модели Gemma 3n|Google AI для разработчиков
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.