
Ключевые выводы
- Tether представила рамки, позволяющие обучать крупные языковые модели на смартфонах.
- Система использовала архитектуру BitNet и тонкую настройку LoRA для снижения потребностей в вычислительных ресурсах.
- Крипто-компании увеличили расходы на инфраструктуру ИИ и высокопроизводительные вычисления.
Tether выпустил новую рамку для обучения искусственному интеллекту во вторник, которая позволяет крупным языковым моделям работать и дообучаться на потребительском оборудовании. Система стала частью платформы QVAC компании и поддерживает смартфоны, а также несколько процессоров, не произведенных Nvidia. Инженеры разработали эту рамку для снижения требований к памяти, тем самым уменьшая барьер на входе для создания и тестирования языковых моделей.
Запуск произошел на фоне того, как компании, занимающиеся криптовалютной инфраструктурой, углублялись в разработку искусственного интеллекта и рынков вычислительных ресурсов. Tether, эмитент крупнейшего стейблкоина по рыночной капитализации, представил выпуск как попытку децентрализовать возможности машинного обучения. Компания утверждала, что возможность обучения моделей на широко доступном оборудовании может снизить зависимость от централизованных облачных провайдеров.
Tether представила систему обучения на базе BitNet
Анонс Tether описал эту систему как обучающую среду, построенную на архитектуре BitNet от Microsoft. Дизайн использовал структуры нейронных сетей с одним битом в сочетании с методами тонкой настройки LoRA, что позволило разработчикам корректировать модели, сохраняя низкие требования к вычислительным ресурсам.
Инженеры компании заявили, что система обучила языковые модели с параметрами до одного миллиарда на смартфонах за менее чем два часа. Меньшие модели, согласно сообщениям, завершили обучение за несколько минут при оптимизации тем же подходом. Компания также заявила, что платформа поддерживает модели с параметрами до тринадцати миллиардов на мобильных устройствах.
Инженеры создали систему для работы на нескольких аппаратных экосистемах, а не полагались исключительно на чипы Nvidia. Фреймворк поддерживал процессоры AMD, архитектуры Intel, системы на базе Apple Silicon и мобильные графические процессоры от Qualcomm и Apple. Эта совместимость расширила доступ к экспериментам с машинным обучением за пределы традиционных кластеров высокопроизводительных вычислений.
Технический дизайн также снизил требования к памяти графики по сравнению со стандартными моделями. Внутренние инженерные результаты показали, что архитектура BitNet сократила использование VRAM до 77,8% по сравнению с аналогичными 16-битными системами.
Tether выводит вычисления ИИ за пределы оборудования Nvidia
Tether заявила, что архитектура позволяет выполнять LoRA-дообучение на оборудовании вне экосистемы Nvidia. Разработчики исторически зависели от графических процессоров Nvidia для задач обучения, поскольку эти чипы эффективно обрабатывали крупные тензорные вычисления. Инженеры Tether попытались устранить это ограничение, позволив методы обучения с низкой точностью на альтернативных процессорах.
Компания утверждала, что архитектура также повысила скорость вывода для мобильных рабочих нагрузок. Тесты показали, что мобильные графические процессоры обрабатывают модели BitNet в несколько раз быстрее, чем стандартные центральные процессоры. Это различие позволило запускать модели локально на портативных устройствах, а не требовать удаленной облачной инфраструктуры.
Разработчики также изучили распределенные методы машинного обучения в рамках системы. Tether описала потенциальные применения моделей федеративного обучения, которые обновляются в сетях независимых устройств. В такой структуре модели обучаются на локальных данных, сохраняя информацию на каждом устройстве, а не загружая ее на централизованные серверы.
Компания предложила, что такой подход может поддерживать среды обучения, ориентированные на конфиденциальность. Данные оставались локальными, а передавались по сетям только обновления модели. Такая архитектура отражала тенденции в децентрализованных вычислительных системах и распределенных криптографических сетях.
Расширение Tether отражает стремление криптоиндустрии к ИИ
Рыночная активность в секторе цифровых активов показала рост инвестиций в инфраструктуру искусственного интеллекта. Криптокомпании все чаще перенаправляют вычислительные мощности, изначально созданные для операций на блокчейне, на задачи машинного обучения.
Публичные документы показали, что технологические компании заключили партнерские соглашения для обеспечения вычислительных мощностей, связанных с потребностью в искусственном интеллекте. Сделка, объявленная в сентябре, предоставила Google минимальную долю в Cipher Mining в рамках 10-летнего соглашения стоимостью 3 млрд долларов. Это соглашение связало мощность центров обработки данных с потребностями в обработке искусственного интеллекта.
Позднее корпоративные заявления указали, что компании по добыче bitcoin также перенаправили капитал на услуги машинного обучения. В декабре майнер IREN представил планы по привлечению примерно 3,6 миллиарда долларов для расширения инфраструктуры для операций в области искусственного интеллекта.
Корпоративные отчеты о прибыли в начале года подтвердили ту же тенденцию. HIVE Digital Technologies сообщила о выручке в размере 93,1 млн долларов после расширения своих услуг по высокопроизводительным вычислениям. В тот же период Core Scientific получила кредитный лимит в 500 млн долларов от Morgan Stanley для поддержки роста своей вычислительной инфраструктуры.
Разработчики также экспериментировали с автономными искусственными интеллектуальными агентами, интегрированными с инфраструктурой блокчейна. Coinbase запустила инструменты кошелька, позволяющие программным агентам выполнять транзакции непосредственно в блокчейне. Alchemy представила сервисы, позволяющие агентам получать доступ к данным блокчейна при одновременной оплате через инфраструктуру стейблкоинов.
Сети идентичности также изучили связь между системами искусственного интеллекта и цифровой верификацией. Сеть идентичности World, сооснованная главой OpenAI Сэмом Альтманом, выпустила AgentKit на этой неделе. Этот набор инструментов позволил программным агентам подтвердить свою связь с уникальной человеческой идентичностью через систему World ID.
Последняя рамка Tether вошла в ту же расширяющуюся сферу, где пересекаются вычислительные ресурсы, машинное обучение и системы блокчейн.
Компания заявила, что разработчики могут интегрировать обучающие инструменты в распределенные приложения и локальные устройства, не полагаясь на централизованные серверы.
Следующий этап развития искусственного интеллекта Tether’s будет зависеть от принятия разработчиками и тестирования производительности на уровне устройств. Инженеры, вероятно, будут отслеживать, как платформа QVAC справляется с крупными моделями на распределённом потребительском оборудовании в ходе предстоящих релизов.
Пост Tether представляет ИИ-фреймворк, позволяющий обучать модели на смартфонах появился первым на The Coin Republic.
