
Ключові інсайти
- Tether представив рамки, що дозволяють навчати великі мовні моделі на смартфонах.
- Система використовувала архітектуру BitNet і тонку налаштування LoRA для зменшення вимог до обчислювальних ресурсів.
- Криптофірми збільшили витрати на інфраструктуру ШІ та високопродуктивні обчислення.
Tether випустила нову рамку для навчання штучного інтелекту в вівторок, яка дозволяє великим мовним моделям працювати та доналаштовуватися на побутовому обладнанні. Система є частиною платформи QVAC компанії та підтримує смартфони разом із кількома процесорами, що не виробляються Nvidia. Інженери розробили цю рамку, щоб зменшити вимоги до пам’яті, тим самим знизивши бар’єр витрат на створення та тестування мовних моделей.
Запуск відбувся на тлі того, як компанії, що розробляють криптовалютну інфраструктуру, глибше занурювалися у розробку штучного інтелекту та ринки обчислень. Tether, випускник найбільшого за ринковою капіталізацією стейблкоїну, представив цей запуск як спробу децентралізувати можливості машинного навчання. Компанія стверджувала, що дозвіл на навчання моделей на широко доступному обладнанні може зменшити залежність від централізованих хмарних провайдерів.
Tether представила систему навчання на основі BitNet
Оголошення Tether описало цю структуру як навчальне середовище, побудоване на архітектурі Microsoft BitNet. Дизайн використовував нейронні мережі з одним бітом у поєднанні з методами тонкої настройки LoRA, що дозволяє розробникам налаштовувати моделі, зберігаючи низькі вимоги до обчислювальних ресурсів.

Інженери компанії сказали, що система навчила мовні моделі з до одного мільярда параметрів на смартфонах за менше двох годин. Менші моделі, за повідомленнями, завершили навчання за хвилини при оптимізації за тим самим підходом. Компанія також заявила, що платформа підтримує моделі з тринадцятьма мільярдами параметрів на мобільних пристроях.
Інженери створили систему, щоб вона працювала в кількох апаратних екосистемах, а не залежала від чіпів Nvidia. Фреймворк підтримував процесори AMD, архітектури Intel, системи на базі Apple Silicon та мобільні графічні процесори від Qualcomm і Apple. Ця сумісність розширила доступ до експериментів з машинним навчанням поза традиційними кластерами високопродуктивних обчислень.
Технічний дизайн також зменшив вимоги до пам’яті графічної карти порівняно зі стандартними моделями. Результати внутрішнього інженерного аналізу показали, що архітектура BitNet зменшила використання VRAM до 77,8% порівняно з порівнянними 16-бітними системами.
Tether розширює AI-обчислення за межі апаратного забезпечення Nvidia
Tether сказала, що архітектура дозволяє LoRA-доналаштування на апаратному забезпеченні поза екосистемою Nvidia. Розробники історично залежали від графічних процесорів Nvidia для завантажень навчання, оскільки ці чіпи ефективно обробляли великі тензорні обчислення. Інженери Tether спробували усунути це обмеження, дозволивши методи навчання з низьким бітом на альтернативних процесорах.
Компанія стверджувала, що архітектура також покращила швидкість висновків для мобільних завдань. Тести показали, що мобільні графічні процесори обробляють моделі BitNet у кілька разів швидше, ніж стандартні центральні процесори. Ця різниця дозволила запускати моделі локально на портативних пристроях, а не вимагати віддаленої хмарної інфраструктури.
Розробники також дослідили розподілені методи машинного навчання всередині системи. Tether описала потенційні застосування моделей федеративного навчання, які оновлюються через мережі незалежних пристроїв. За такої структури моделі вчаться на локальних даних, зберігаючи інформацію на кожному пристрої, а не завантажуючи її на централізовані сервери.
Компанія запропонувала, що підхід може підтримувати навчальні середовища, орієнтовані на конфіденційність. Дані залишалися локальними, а передавалися лише оновлення моделей. Ця архітектура відображала тенденції в децентралізованих обчислювальних системах та розподілених криптографічних мережах.
Розширення Tether відображає штучний інтелект у криптовалютній індустрії
Ринкова активність у секторі цифрових активів показала зростання інвестицій у інфраструктуру штучного інтелекту. Криптофірми все частіше переорієнтовували обчислювальні потужності, спочатку створені для операцій з блокчейном, на завдання машинного навчання.
Публічні документи показали, що технологічні компанії утворили партнерства для забезпечення обчислювальних потужностей, пов’язаних із попитом на штучний інтелект. У вересні було оголошено угоду, згідно з якою Google отримав міноритарну частку у Cipher Mining у рамках 10-річної угоди вартістю 3 мільярди доларів США. Ця угода зв’язала потужність центрів обробки даних із потребами у обробці штучного інтелекту.
У подальших корпоративних оголошеннях зазначалося, що компанії з видобутку bitcoin також перенаправили капітал на послуги машинного навчання. У грудні майнер IREN оприлюднив плани збільшити інфраструктуру для операцій штучного інтелекту на суму близько 3,6 мільярда доларів США.
Звіти про корпоративні прибутки на початку року підтвердили ту саму тенденцію. HIVE Digital Technologies повідомила про дохід у розмірі 93,1 мільйона доларів після розширення своїх послуг з високопродуктивних обчислень. Приблизно в той самий період Core Scientific отримала кредитний лінію на 500 мільйонів доларів від Morgan Stanley для підтримки зростання своєї обчислювальної інфраструктури.
Розробники також експериментували з автономними штучними інтелектуальними агентами, інтегрованими з інфраструктурою блокчейн. Coinbase запустила інструменти гаманця, які дозволяють програмним агентам виконувати транзакції безпосередньо в ланцюжку. Alchemy представила сервіси, які дозволяють агентам отримувати доступ до даних блокчейну, а також розраховуватися за допомогою інфраструктури стейблкоїнів.
Мережі ідентичності також дослідили зв’язок між системами штучного інтелекту та цифровою верифікацією. Світ, мережа ідентичності, спільно заснована керівником OpenAI Семом Альтманом, на початку цього тижня випустила AgentKit. Цей інструментарій дозволив програмним агентам верифікувати своє з’єднання з унікальною людською ідентичністю за допомогою системи World ID.
Найновіша рамка Tether увійшла в той самий розширюваний сектор, де перетинаються обчислювальні ресурси, машинне навчання та системи блокчейн.
Компанія сказала, що розробники можуть інтегрувати інструменти навчання в розподілені додатки та локальні пристрої, не залежачи від централізованих серверів.
Наступний етап розвитку інтелектуальної системи Tether’s залежатиме від прийняття розробниками та тестування продуктивності на рівні пристроїв. Інженери, ймовірно, будуть відстежувати, як платформа QVAC справляється з великими моделями на розподіленому споживчому обладнанні під час майбутніх випусків.
Пост Tether представила AI-фреймворк, що дозволяє навчати моделі на смартфонах з’явився першим на The Coin Republic.
