OpenAI завершила оренду свого майбутнього у Nvidia. Компанія оголосила про партнерство з Broadcom щодо розробки спеціалізованих AI-акселераторів, оптимізованих саме для великих мовних моделей, з планом впровадження з другої половини 2026 року до кінця 2029 року.
Масштаби захоплюють: 10 гігаватів спеціалізованих AI-ускорерів.
Як виглядає цей партнерський договір
Розподіл обов’язків тут чіткий. OpenAI займається проектуванням прискорювачів, впроваджуючи глибоке розуміння навантажень LLM безпосередньо в архітектуру чіпа. Broadcom відповідає за розробку, виробництво та розгортання цих систем, інтегруючи їх із власними технологіями Ethernet-мереж.
Це не перше зближення OpenAI зі спеціальними чіпами. У вересні 2025 року з’явилися повідомлення, що компанія працює з Broadcom над акселераторним чіпом «XPU», призначеним для виробництва у 2026 році. Оголошення від 13 жовтня підтверджує та значно розширює ці зусилля.
«Розробка наших власних прискорювачів додає до ширшої екосистеми», — сказав генеральний директор OpenAI Сем Олтман.
Генеральний директор Broadcom Хок Тан більш прямо сформулював амбіції, описавши мету як «спільну розробку та впровадження 10 гігаватів прискорювачів наступного покоління».
Встановлення буде поступово реалізовано в власних об’єктах OpenAI та афілійованих центрах обробки даних.
Чому OpenAI потрібен власний чіп
Згідно з повідомленнями, у OpenAI більше 800 мільйонів тижневих активних користувачів, які використовують його хмарні AI-сервіси. Запуск великих мовних моделей у такому масштабі надзвичайно витратний, а спеціалізовані прискорювачі дозволяють OpenAI безпосередньо вбудовувати свої архітектурні ідеї у апаратне забезпечення — замість написання програмного забезпечення, яке обходить обмеження чіпа, ви створюєте чіп, спроектований саме під точні потреби вашого програмного забезпечення.
Це та сама стратегія, яку застосував Google зі своїми чіпами TPU (Tensor Processing Unit). Amazon слідував зі своїми чіпами Trainium та Inferentia для AWS. Microsoft має свої прискорювачі Maia.
Що це означає для конкурентної карти
Інтеграція Ethernet-мереж Broadcom — це важливий деталь. Високомасштабний висновок ШІ — це не лише про швидкі чіпи, а й про ефективне переміщення даних між чіпами. Поєднуючи свій досвід у мережах із дизайнами прискорювачів OpenAI, Broadcom може запропонувати рішення «з кінця до кінця».
Термін розгортання 2026–2029 років має значення для будь-кого, хто моделює фінансові показники OpenAI. Спеціалізовані чіпи вимагають часу для отримання прибутку, але після запуску вони можуть значно знизити витрати OpenAI на обчислення на запит. При 800 мільйонах тижневих активних користувачів і зростанні навіть невеликі підвищення ефективності на інференс перетворюються на заощадження в розмірі мільярдів доларів щороку.
