Стенфордський центр людини та штучного інтелекту (HAI) опублікував щорічний звіт AI Index 2026 року — найавторитетніший щорічний огляд стану галузі штучного інтелекту. За минулий рік дослідники Стенфорда на основі ряду спостережень зробили ключовий висновок: штучний інтелект приймається по всьому світу швидше, ніж ПК та Інтернет, але інститути людського суспільства, ринок праці та інструменти вимірювання повністю відстають.
Штучний інтелект вже на старті, а люди ще шукають взуття. Десять зображень, що показують, де ШІ вже обігнав людину.
1
Вимірювання штучного інтелекту за допомогою екзаменів не має сенсу

Заголовки типу «ШІ перевершив людину» ґрунтуються на надійності benchmark-тестів. Але звіт Стенфордського університету виявив, що майже 42% завдань у широко використовуваному математичному benchmark-тесті GSM8K є недійсними. Інші тести також підозрюються у «зазубрюванні»: моделі, навчені на тестових даних, можуть отримувати високі бали, але це не означає, що вони стали розумнішими. Багато компаній відмовляються публікувати відповідні результати benchmark-тестів. Один із авторів звіту, Джил, сказав: «Сама відмова публікувати результати може щось говорити».
2
Розрив між Китаєм і США практично зник — лише 2,7%

На березень 2026 року Elo-рейтинг найсильнішої моделі США Claude Opus 4.6 становить 1503, а найсильніша китайська модель йде за нею з різницею лише 2,7%. Протягом останнього року моделі обох країн неодноразово змінювали лідерство, а в лютому 2025 року DeepSeek R1 тимчасово зрівнялася з найсильнішою моделлю США.
Проте переваги двох країн у сфері ШІ повністю відрізняються. США мають потужніші моделі, більше капіталу та 5427 центрів обробки даних — більше ніж у 10 разів, ніж будь-яка інша країна. Китай лідирує у кількості наукових статей, патентів та розгортанні роботів. Просто кажучи, США перемагають завдяки обчислювальній потужності та грошам, а Китай — завдяки дослідженням та виробництву.
3
Передові моделі збігаються, рівень інтелекту однаковий

На березень 2026 року Anthropic (1503), xAI (1495), Google (1494) та OpenAI (1481) згуртовані в дуже вузькому діапазоні. Це означає, що «яка модель потужніша» більше не є ключовим аспектом конкуренції. Фокус зміщується на витрати, надійність та оптимізацію для конкретних галузей — що пояснює, чому Anthropic розробляє Advisor Tool (зменшення витрат), Google купує Wiz (хмарна безпека), а OpenAI придбуває різноманітні компанії на рівні застосунків (розширення сценаріїв). У умовах поступового зближення інтелектуальних показників самих моделей, необхідно створювати диференціацію в інших сферах.
4
Зайнятість розробників віком 22–25 років знизилася майже на 20%

Генеративний ІІ за три роки досяг рівня прийняття понад 53% населення, і 88% організацій вже використовують ІІ. Однак вплив на зайнятість не є рівномірним. Дослідження економістів Стенфордського університету 2025 року виявило, що кількість працівників-розробників програмного забезпечення віком 22–25 років знизилася майже на 20% з 2022 року, тоді як у старших групах вона продовжує зростати. За даними дослідження McKinsey 2025 року, третина організацій очікує, що протягом наступного року скоротять кількість співробітників через ІІ, причому скорочення зосереджені в сфері сервісних операцій, ланцюга поставок та програмної інженерії.
Загальні дані ще не показують масових звільнень, але цього достатньо, щоб зрозуміти: ринок праці поступово погружується у кризу, яка повільно росте.
5
Швидкість прийняття перевищує ПК та інтернет, США займають лише 24-те місце

Генеративний ІІ досягне рівня прийняття населенням 53% за три роки — це швидше, ніж персональні комп’ютери та інтернет. Але найбільш неочікуваним даним є те, що США лідирують у світі щодо інвестицій у ІІ та розробки моделей, але рівень прийняття населенням становить лише 28,3% — 24-те місце у світі. ОАЕ — 64%, Сінгапур — 60,9%. Країни, які найбільше витрачають гроші, — найменше користуються.
6
Глобальні інвестиції в ІІ $581,7 млрд, США — у 23 рази більше, ніж Китай, але...

У 2025 році загальні інвестиції у компанії зі штучним інтелектом у світі досягли $581,7 млрд, що на 129,9% більше, ніж у попередній період. Приватні інвестиції у Штатах у сферу ШІ склали $285,9 млрд — у 23 рази більше, ніж у Китаї, і у 48,5 рази більше, ніж у Великобританії. Лише Каліфорнія становить понад 75% усіх інвестицій у США. Також було зафіксовано багато великих угод: OpenAI зібрала $40 млрд при оцінці в $300 млрд; Anthropic отримала $13 млрд при оцінці в $183 млрд; Cursor зібрала $2,3 млрд при оцінці в $29,3 млрд.
Але тут є прихована інформація: у Китаї державні інвестиційні фонди вклали приблизно 184 мільярди доларів США у компанії з області ШІ з 2000 по 2023 рік, і ці кошти не були включені до статистики приватних інвестицій. Якщо додати цю суму, розрив у фінансуванні між Китаєм і США може бути набагато меншим, ніж здається за офіційними даними.
7
AI-агент: від здатності розмовляти до здатності виконувати завдання, але з імовірністю невдачі 1/3

2025 рік — рік AI агентів. Точність OSWorld (тестування здатності AI виконувати завдання в операційній системі) зросла з 12% до 66,3%, що на 6 процентних пунктів менше, ніж людський рівень. WebArena досяг 74,3%, а Cybench (завдання з кібербезпеки) зросла з 15% до 93%.
Проте загалом агент все ще має приблизно 1/3 відсотка невдач. Крім того, реальне розгортання підприємствами все ще знаходиться на однозначному рівні — більш ніж 2/3 опитаних у більшості сценаріїв бізнесу заявили, що взагалі не використовують AI-агенти. Між прогресом на тестах і реальним розгортанням існує величезна різниця.
8
89% роботів живуть у лабораторії

Штучний інтелект уже дуже сильний у віртуальному світі, але ще слабкий у фізичному. У програмних симуляціях успішність роботизованих операцій становить 89,4%, але у реальних домашніх завданнях — лише 12,4%. Один це чиста лабораторія, інший — хаотичний дім; у цьому реальному середовищі участь роботів ще мізерна.
Однак автономне керування — це виняток: Waymo здійснює приблизно 450 000 поїздок на тиждень, а Apollo Go завершив приблизно 11 мільйонів повністю безпілотних поїздок у 2025 році.
9
Експерти проти громадськості: розрив у усвідомленості 73% проти 23%

Цитований дослідження Pew виявив дивовижний розкол: 73% експертів з ІІ вважають, що ІІ матиме позитивний вплив на роботу, але лише 23% американської громадськості думають так само — повна поляризація.
Ще одні цікаві дані: серед усіх опитаних країн американці найменше довіряють урядовому регулюванню ШІ. Експерти також більш оптимістично ставляться до перспектив ШІ в освіті та охороні здоров’я, але обидві групи вважають, що ШІ завдасть шкоди виборам і людським стосункам.
10
GPT-4o за рік використовує більше води, ніж 12 мільйонів людей, а електроенергії, яку він споживає, вистачило б на весь штат Нью-Йорк

Прогрес у галузі ШІ супроводжується ціною для навколишнього середовища. Глобальні центри обробки даних ШІ зараз споживають 29,6 ГВт електроенергії — цього обсягу достатньо, щоб забезпечити електроенергією весь штат Нью-Йорк у період пікового навантаження. Лише одна модель OpenAI GPT-4o може споживати річний обсяг води, що перевищує потреби у питній воді 12 мільйонів людей.
Ці величезні витрати спрямовуються в неперервне навчання моделей, тоді як ланцюжок постачання чіпів, що лежать в основі цих моделей, надзвичайно хрупкий. США мають більшість світових центрів обробки даних з штучним інтелектом, але майже кожен передовий чіп для штучного інтелекту виробляється лише однією компанією — TSMC з Тайваню. Вся обчислювальна потужність, всі інвестиції та всі досягнення в моделях ґрунтуються на цій фізичній основі.
Це лише вершина айсберга звіту, але достатньо, щоб побачити: ми використовуємо найшвидший у історії темп, щоб «прийняти» технологію, яку ще не повністю розуміємо.
Повний звіт також охоплює більше аспектів, таких як безпека ШІ, регуляторні зміни, наукові тенденції тощо. Настійно рекомендуємо зацікавленим читачам ознайомитися з повним текстом звіту: 👉🏻 https://hai.stanford.edu/ai-index
Цей матеріал зі сторінки微信-каналу “APPSO”, автор: APPSO — відкриває продукти завтрашнього дня
