Android, iOS, HarmonyOS та Windows входять у еру агентів із інтеграцією ШІ на рівні ОС

icon MarsBit
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Новини про штучний інтелект та криптовалюту показують, що основні гравці в сфері ОС просувають інтеграцію агентів на системному рівні. Google, Apple, Microsoft та Huawei тепер пропонують платформи з вбудованим ШІ, зокрема Gemini Intelligence, Foundation Models, Copilot+PC та HarmonyOS 6 з HMAF. Ці системи підтримують крос-додаткову автоматизацію та покращену конфіденційність. Основні компоненти включають AI Runtime, керовані чіпи та матриці моделей «кінець-хмарний». Новини про криптовалюту підкреслюють, як глибша інтеграція ШІ змінює конкуренцію серед ОС.

Автор: Хуан Юньхао, із серії «Хмарний потік AI»

. Після Google I/O 2026: чотири основні ОС на пристроях входять у еру агентів

12 травня 2026 року Google провела презентацію Android Show|I/O Edition — окрему подію з Android перед I/O-конференцією 19 травня. Президент екосистеми Android Семер Самат визначив ціль цієї презентації: Android має перетворитися з операційної системи на інтелектуальну систему. Основою цієї ідеї є Gemini Intelligence — набір активних AI-можливостей на рівні системи Android.

Вікна

2026 рік, Android Show | Постер випуску I/O Edition
Джерело: Android Heaadlines

У порівнянні з комбінацією Gemini Nano+AICore минулого року, Google тепер глибше інтегрував здатність агента працювати між додатками та в контексті на рівні ОС: автоматизація завдань між додатками (замовлення їжі, покупки, оформлення замовлень), автоматичне заповнення форм, стислі висновки з веб-сторінок, налаштовувані віджети — усі ці функції додано до списку системних можливостей. Google також визначив три основні принципи продукту: явний контроль користувача (explicit user control), всебічна захиста даних (comprehensive data protection) та операційна прозорість (operational transparency).

На тематичному виступі I/O 19 травня через тиждень генеральний директор Google Sundar Pichai розпочав з цієї ідеї:

Ласкаво просимо в еру агентного Gemini(Ласкаво просимо в еру агентного Gemini)

Участь у хвилі переходу на OS-агенти на кінцевих пристроях — у Google не було найранішого старту.

Microsoft на Build 2024 у травні 2024 року представила Copilot+ PC (нова лінійка пристроїв з Windows 11 з NPU з продуктивністю понад 40 TOPS), інтегрувавши можливості агента в операційну систему за допомогою трьох функцій: малих моделей на пристрої Phi Silica, можливості екранного агента Click to Do та системної пам’яті про діяльність Recall.

На WWDC24 у червні 2024 року Apple офіційно оголосила про «Apple Intelligence», яку на той момент позначила як «персональну інтелектуальну систему». Пізніше було поступово запущено кілька функцій з підтримкою ШІ, проте через проблеми з розробкою власної великої моделі та «недоумку» Siri, основна функція агента Apple Intelligence так і не була представлена.

华为 на HDC 2025 у червні 2025 року представила HarmonyOS 6 та фреймворк гармонійних інтелектуальних агентів (HMAF), після чого на платформі Xiao Yi Intelligent Agent Square з’явилося понад 80 інтелектуальних агентів.

Велика тенденція до перетворення операційних систем на кінцевому пристрої вже спостерігається на таких основних операційних системах, як Android, iOS, HarmonyOS та Windows.

На презентації показано лише функції, а справжнім конкурентним перевагою виробників ОС є трьохрівнева основа, що забезпечує надійне функціонування OS Agent і розв’язує реальні проблеми: системний AI Runtime, керований чіп, матриця моделей «кінець-хмарна».

Два. Під презентацією: три підвалини, що підтримують OS Agent

Системний AI Runtime: центр управління інтелектом на пристрої

Runtime — це інференсний рушій і системні служби, які виконують модель на пристрої. Знизу він безпосередньо взаємодіє з NPU та системними ресурсами, а зверху надає стабільні API для надання можливостей інференсу всім додаткам. Він перетворює моделі на пристрої на «розум на рівні ОС»: забезпечує спільне використання ваг моделей між додатками, уніфіковане планування обчислювальних ресурсів та пам’яті, підтримує виклик інструментів, необхідних для агентів, керує генерацією, а також інтегрує контекст та права доступу. Він визначає, чи буде OS Agent лише кнопкою чату всередині додатка, чи постійно працюючою службою на рівні операційної системи, здатною виконувати системні операції.

Найповнішим зразком у системі Android є Google AICore. У грудні 2023 року AICore був запущений як системна служба (system service) у Android 14; у серпні 2025 року Gemini Nano став доступним для розробників через ML Kit GenAI APIs. Від системної основи до стабільних API для додатків AICore пройшов понад два роки постійної доробки.

Інші виробники ОС йдуть тією ж дорогою, але з іншим темпом. Apple на WWDC25 відкрила для розробників фреймворк Foundation Models, який має вбудовані декоратор @Generable, виклик інструментів, кероване генерування та станові сесії, які працюють з боковими базовими моделями на 3 млрд параметрів, підтримуваними обчисленнями у приватному хмарному середовищі. Microsoft вбудувала фреймворк Foundry on Windows та Phi Silica у Windows 11, використовуючи Windows ML як нижчий інференсний бекенд. Huawei на HDC 2025 представила Agent Framework Kit (фреймворк агентів HarmonyOS, HMAF), відкривши систему намірів та протокол співпраці агентів.

Вікна

Android AICore як системний сервіс планує виконання Gemini Nano на апаратному прискорювачі
Джерело: Android Developers

Керований чіп: точка опори для спільної роботи програмного та апаратного забезпечення

Google встановив чіткі апаратні вимоги для Gemini Intelligence на Android Show|I/O Edition: повний набір функцій буде доступний лише для кількох найновіших флагманських моделей, таких як Pixel 10 та Galaxy S26, а всі моделі минулого року не підходять. Це вказує на простий факт: AI-моделі все ще швидко розвиваються, а програмне забезпечення постійно висуває нові вимоги до апаратного забезпечення. Контрольовані чіпи є основою для виконання цих вимог, а ступінь контролю визначає простір, який виробники ОС мають для адаптації ПЗ та АП для агентів ОС на пристроях.

Apple є зразком інтегрованого підходу до програмного та апаратного забезпечення. iOS та macOS з самого початку розвивалися разом із чіпами серій A та M, а Core ML об’єднав керування CPU, GPU та ANE на рівні фреймворку. Цей підхід продовжує розвиватися в епоху LLM. Apple Machine Learning Research надала такі реальні дані: за допомогою оптимізацій Core ML розгортання Llama 3.1 8B Instruct на M1 Max забезпечує локальну швидкість декодування приблизно 33 токени/с. У технічному звіті «Apple Intelligence Foundation Language Models» також зазначено, що Apple провела архітектурні оптимізації, зокрема спільне використання KV cache та квантування з урахуванням 2-бітного навчання, щоб успішно відкрити для розробників базову модель розміром близько 3B через фреймворк Foundation Models. Такого рівня глибини можна досягти лише тоді, коли ви володієте чіпами — саме це й є цінністю контролюваного чіпа для виробників ОС: він визначає глибину синергії програмного та апаратного забезпечення, а також підвищує верхню межу досвіду енд-пойнт OS Agent.

Увійшовши в еру ШІ, Google робить те саме — з Pixel 6 він вибрав шлях власного SoC Tensor, а найновіший Tensor G5 збільшив продуктивність TPU до 60%, а CPU — в середньому на 34%, ставши першим SoC, який повністю запускає останню версію Gemini Nano на Pixel 10. Однак у Tensor G5 є й слабкі місця: за результатами тестування Android Central, його обсяг пам’яті (RAM) залишається обмеженням для продуктивності ШІ, а результати Geekbench AI нижчі, ніж у Snapdragon 8 Elite; у тестах Geekbench 6 від Macworld одноядерні та багатоядерні показники G5 нижчі, ніж у A18 Pro. Google ще гонить, але стратегія власного Tensor у поєднанні з Gemini на пристрої вже сформувалася.

Комбінація Huawei Kirin з NPU DaVinci та моделями Pangu на кінцевому пристрої — це ще один незалежний шлях чіпів, паралельний Apple та Google. Xiaomi запустила Xuanjie O1, ставши новим учасником у напрямку незалежних чіпів.

Матриця моделей «кінцевий пристрій — хмара»: джерело інтелекту агента

Матриця моделей «кінець-хмарна» є джерелом «інтелекту» для кінцевих пристроїв: хмарні моделі визначають верхню межу здатностей до складних завдань, а кінцеві моделі забезпечують мінімальний рівень повсякденного функціонування — затримка, автономність, приватність і стабільність лежать на плечах кінцевої сторони. Обидві сторони незамінні, різниця полягає в глибині взаємодії з ОС. Кінцеві моделі мають бути вбудовані в ОС кожного кінцевого пристрою та глибоко інтегровані з локальним NPU, виконуючи подвійну роль в ОС: знизу — це локальний бекенд інференсу для Runtime; згори — вони через фреймворк і SDK Runtime відкриваються як системні API для додатків.

Власна розробка має сенс як у хмарі, так і на кінцевих пристроях, але віддача від кінцевих пристроїв більш очевидна. Зовнішні хмарні моделі можуть забезпечити верхню межу можливостей, а переваги власної розробки полягають переважно у контролі над маршрутизацією, умовах угод та темпах ітерацій моделі. З кінцевими пристроями інакше. Моделі на кінцевих пристроях вбудовуються в ОС та NPU кожної пристрою, і віддача від власної розробки безпосередньо відображається на продуктивності продукту: спільне використання KV cache, 2-бітне квантування з урахуванням архітектури конкретного покоління чіпів, Per-Layer Embedding (походить від Gemma 3n, інкрементне завантаження параметрів вкладення з швидкої пам’яті на рівні шару) тощо — все це легко реалізувати лише за умови синхронного проектування моделі та апаратного забезпечення; крім того, синхронізація розробки більше не повинна залежати від сторонніх виробників апаратного забезпечення.

TPU Tensor G5 має потужність на 60% вищу, ніж попереднє покоління G4, але підвищення продуктивності Gemini Nano на G5 йде ще далі — згідно з офіційними даними Google та Jon Peddie Research, локальна швидкість обробки зросла у 2,6 рази, споживання енергії зменшилося наполовину, а вікно tokenів розширилося з 12 000 до 32 000 (що еквівалентно обробці близько ста скріншотів за раз). Ці значні переваги в продуктивності досягнуті завдяки архітектурі Matryoshka Transformer у Gemini Nano v3, поєднаній з синергією оптимізації з TPU Tensor G5.

Вікна

Gemini Nano на Tensor G5 — стрибок у продуктивності порівняно з попереднім поколінням
Джерело: Google/Jon Peddie Research, ілюстрації створені хмари AI

На рівні моделей на кінцевих пристроях кожен з головних виробників ОС має власні розробки: Gemini Nano від Google, базова модель на кінцевому пристрої від Apple з приблизно 3 млрд параметрів, Phi Silica від Microsoft та паньгуанська модель на кінцевому пристрої від Huawei. Власна розробка — це за замовчуванням вибір на цьому рівні.

Три. Між трьома рівнями: чим глибше співпраця, тим більше простору для диференціації

Три рівні здібностей, з’єднані знизу вгору: керований чіп → модель на кінцевому пристрої/у хмарі → Runtime → Agent. Керований чіп визначає ефективність висновку та споживання енергії моделі на кінцевому пристрої, модель на кінцевому пристрої визначає локальну інтелектуальну здатність, яку може планувати Runtime, а Runtime визначає надійність виконання Agent як системної служби між додатками. Чим глибше взаємодія між ними, тим більшою є диференціація досвіду продукту виробників ОС на кінцевих пристроях і тим ширшою є їхня конкурентна перевага.

Чим глибше три рівні інтегровані в одній системі програмного та апаратного забезпечення, тим більше продукт OS Agent демонструватиме відмінності, яких неможливо досягти на одному рівні.

  • Затримка відповіді та споживання енергії. Gemini Nano досягає 2,6-кратного збільшення швидкості обробки та зменшення споживання енергії наполовину на Tensor G5 завдяки взаємній адаптації архітектури моделі, проектування чіпа та планування Runtime в межах однієї генерації програмного та апаратного забезпечення — саме такі масштабні покращення і виникають.
  • Приватність і довіра. Завдання, що стосуються приватних даних, виконуються локально на пристрої за допомогою моделей на кінці, а складні запити передаються до хмари — це розумна за замовчуванням позиція OS Agent щодо даних користувача на поточному етапі. Три взаємопов’язані компоненти визначають, чи зможе ця стратегія «пріоритет на кінці, хмара як резерв» бути реалізована на практиці: глибока адаптація NPU до моделей на кінці — це ключовий шлях для того, щоб моделі на кінці, що ще перебувають у розвитку, могли виконувати часті локальні висновки; квантування та стиснення моделей для NPU зі спільним використанням KV cache; Runtime маршрутизує завдання між кінцем і хмарою залежно від їхньої складності. Якщо хоча б один із цих трьох компонентів не виконаний належним чином, «пріоритет на кінці» залишиться лише маркетинговим слоганом.
  • Системний контекст. Виробник ОС перетворює користувацькі дані, що охоплюють додатки та рівень ОС (семантичний індекс, сприйняття екрана, довгострокова пам’ять), у системний персоналізований контекст для агента — це передумова для справжнього «розуміння користувача» агентом і ключова відмінність між агентом ОС та агентами, що працюють лише на рівні окремих додатків. Реалізація залежить від трьох взаємопов’язаних рівнів: Runtime зберігає міждодатковий індекс та дозволи, модель на пристрої завжди активна для розуміння та висновків, а NPU забезпечує локальну ефективну обчислювальну потужність. Apple’s Core Spotlight створює семантичний індекс на пристрої, а додатки підключають дії та дані до системи через App Intents; агент отримуватиме контекст через Personal Context (Apple вже оголосила, що ця функція з’явиться з майбутніми оновленнями ПЗ); Android-сторона AppFunctions йде тим самим шляхом.
  • Надійність як системної служби. OS Agent має бути викликаний як системна служба і залишатися доступним у реальних умовах, таких як відсутність підключення до Інтернету, низький рівень заряду батареї, перегрів тощо. Моделі на кінцевому пристрої завжди працюють на пристрої, дозволяючи Agent працювати без інтернету; високоефективна оптимізація програмного та апаратного забезпечення NPU забезпечує низькоенергоспоживання; Runtime при дефіциті ресурсів пристрою здійснює резервне планування за доступністю (переключається на більш легкі моделі або пересилає запити до хмари). Якщо будь-який з трьох компонентів відсутній, OS Agent не зможе виконувати функції системної служби і зведеться до кнопки чат-бота на рівні додатку.

Apple Intelligence представляє повну синергічну парадигму: Apple Silicon, приблизно 3 млрд локальних базових моделей, фреймворк Foundation Models, що працює знизу вгору, обробляє типові сценарії на пристрої, а складні запити передаються на приватні хмарні обчислення. Google — це інша форма. Tensor G5, як перший SoC, що повністю виконує останню версію Gemini Nano, впроваджується у Pixel 10, де AICore координує всі операції, дозволяючи системним агентним функціям, таким як Magic Cue та Pixel Screenshots, працювати за замовчуванням без залежності від хмари. Huawei є зразком у країні щодо створення трьохрівневої синергії: Kirin, NPU Da Vinci, Pangu на пристрої та HMAF — усе власне, що знизу вгору сполучено в єдину трьохрівневу основу.

Вікна

Трьохрівневий механізм зчеплення OS Agent на краю
Джерело: Хмарний потік AI


Чотири.
На основі: інші ключові змінні довгострокового конкурентного переваги

Сутью створення конкурентної переваги є трьохрівнева співпраця. На основі існує багато змінних, що впливають на конкурентоспроможність продуктів епохи OS Agent, зокрема здатність взаємодії агента з додатками, захист приватності тощо.

Взаємодія OS Agent із додатками відбувається на передовій лінії боротьби між виробниками ОС і виробниками додатків. Зараз існують дві паралельні шляхи. Один — це розпізнавання екрана та автоматизація, включаючи Gemini Live з поділом екрана, Apple Visual Intelligence, Circle to Search тощо. OS Agent втручається в додатки, читаючи екран і натискаючи кнопки — це працює для одноразових завдань, але кожен виклик не містить структурованої інформації, і важко стабільно побудувати багатокрокові робочі процеси. Інший шлях — глибока інтеграція через API, включаючи Google AppFunctions, Apple App Intents, Huawei Intents Kit тощо. Додатки відкривають свої ключові функції через структуровані інтерфейси для системи, що дозволяє Agent викликати їх стабільно та будувати багатокрокові робочі процеси. Чи зможе шлях API отримати широке поширення, залежить не від виробників ОС, а від виробників додатків. Надання ключових функцій для виклику через Agent означає, що користувачі можуть більше не відкривати додатки безпосередньо — це створює ризик втрати брендингу, рекламних місць, поведінкових даних та точок оплати, які може перехопити ОС. Це буде ключовим пунктом боротьби за контроль над розподілом трафіку на стороні користувача.

Захист приватності — це ключова цінність і межа бокової системи. Виробники ОС мають найглибші системні права та найбільш чутливі дані користувача на боковому пристрої; приватність є не лише їхньою професійною позицією, а й передумовою для довгострокового розвитку двох попередніх аспектів. Apple створила систему захисту приватності на основі термінального пристрою, використовуючи ту саму апаратну безпеку, яка спільно використовується між боковим Secure Enclave та вузлами приватного хмарного обчислення PCC. Ця продуктова стратегія перетворила «Privacy. That’s Apple.» на ключовий брендовий лейбл Apple на глобальному ринку преміум-сегменту, що дозволило здобути довіру користувачів.

Вікна

Мітка Apple «Приватність. Це Apple.»
Джерело: офіційний сайт Apple

Три рівні співпраці є ядром створення конкурентної переваги, а ці довгострокові змінні на основі дна визначають, наскільки глибоко її можна посилити.

П’ятим. Це не просто переробка OS

У контексті тенденції до перетворення операційної системи на кінцевому пристрої на агента, чим міцнішими є три базові компоненти — системний AI Runtime, керовані чіпи та матриця моделей кінцевий пристрій-хмарка, тим вищою є мінімальна межа продукту для виробників ОС і тим більшим є простір для диференціації. Лише виробники ОС, які вловлюють цю тенденцію, матимуть можливість вплинути на перерозподіл трафіку кінцевих точок і зайняти сильніші позиції у конкуренції.

Ця тенденція не обмежується лише мобільними пристроями та ПК. Базові можливості OS Agent поширюються через вже створені екосистеми багатопристроєвих пристроїв на більш широкий спектр терміналів, особливо в сфері IoT. Контролери знижуються до сценаріїв, таких як автономні SoC: Huawei вже розробила автопромислові чіпи Kirin, а Xiaomi PiOS впроваджується у власні моделі автомобілів; моделі на кінцевих пристроях легкіше мігрують до нових форм-факторів, таких як окуляри: інтелектуальні окуляри Android XR, розроблені Google, Samsung, Gentle Monster та Warby Parker, будуть випущені восени 2026 року; взаємодія Runtime та Agent розширюється через вже встановлені фреймворки «супер-термінал/розподілена» архітектура, наприклад, Huawei 1+8+N та HarmonyOS Distributed Soft Bus, Xiaomi «повна екосистема людина-авто-дім» та HyperConnect, Apple Continuity, Google Cross-device SDK та міжпристройові сервіси. Ця битва OS Agent далеко не обмежується перемогою чи поразкою на ринку мобільних пристроїв та ПК.

AICore вдосконалювалася близько двох років; операційна система Apple та серія чіпів Apple Silicon працювали разом понад десять років; Tensor поступово модифікувалася до G5, щоб Pixel 10 зміг впоратися з завданням Gemini Nano v3. Перевага в цій битві завжди визначалася не на презентаціях протягом одного-двох годин, а в результаті поколінь чіпів, моделей та Runtime.

Джерела:

  • Gemini Intelligence вводить проактивний ІІ на Android|Блог Google
  • I/O 2026: Ласкаво просимо до ери агентного Gemini|Блог Google
  • Phi Silica — малий, але могутній SLM на пристрої | Windows Experience Blog
  • Apple безстроково відкладає оновлення Siri|Bloomberg
  • Запуск бета-версії розробника HarmonyOS 6 (HDC 2025) | Huawei
  • Найновіший Gemini Nano з API ML Kit GenAI на пристрої|Блог розробників Android
  • Документація фреймворку Foundation Models|Apple Developer
  • Білійна книга фреймворку хунхэньських інтелектуальних агентів | Розробник Huawei
  • Llama 3.1 на пристрої з використанням Core ML|Apple Machine Learning Research
  • Apple Intelligence Foundation Language Models Tech Report 2025|Apple Machine Learning Research
  • Google Tensor G5: Результати тестів і все, що вам потрібно знати|Android Central
  • Новий M5 SoC від Google (Tensor G5: детальний розгляд · Matryoshka Transformer) | Jon Peddie Research
  • Приватні обчислення в хмарі: Нова межа для конфіденційності ШІ в хмарі|Apple Security Engineering
  • Огляд AppFunctions|Android Developers
  • App Intents|Apple Developer
  • Огляд Intents Kit (HarmonyOS) | Розробник Huawei
  • Чіп Tensor G5 у Google Pixel 10 Pro вражає — якщо порівнювати його з iPhone 14|Macworld
  • Огляд моделі Gemma 3n|Google AI для розробників
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.