ByteDance відкрила вихідний код мультимодальної моделі Lance з 3 мільярдами параметрів, навченої на 128 GPU A100

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
ByteDance відкрила код свого мультимодального моделі з 3 мільярдами параметрів Lance 19 травня, навчаючи його за допомогою 128 GPU A100. Модель обробляє завдання з зображеннями та відео в одній системі. Дані ланцюга показують зростання відкритого інтересу до криптовалютних проектів, що базуються на ШІ. Lance використовує двопотокову архітектуру MoE та модальність-освідомлене кодування обертання, щоб знизити витрати, зберігаючи високу продуктивність. Відкритий інтерес до токенів, пов’язаних з ШІ, стабільно зростав цей квартал.

ME News: 19 травня (UTC+8), за даними моніторингу Beating, ByteDance Research офіційно відкрила вихідний код нативної уніфікованої багатомодальної великої моделі Lance. Це легковажна модель з лише 3 млрд активованих параметрів, яка в одній архітектурі підтримує розуміння, генерацію та редагування зображень і відео. Наразі основні уніфіковані моделі сильно залежать від збільшення кількості параметрів або використання архітектур текст-до-зображення; Lance ж реалізував підхід з мінімальними обчислювальними витратами. Команда розробників навчала модель повністю з нуля та зменшила загальний обчислювальний бюджет тренування до 128 GPU A100. Щоб вирішити внутрішні конфлікти між різними модальностями та завданнями, Lance впровадив дві жорсткі ізоляції в архітектурі: - Використання двопотокової архітектури змішаних експертів (MoE) для обробки переплетених багатомодальних послідовностей, що дозволяє розділити обчислювальні шляхи розуміння та генерації при спільному нижньому контексті. - Введення модальністно-відчутних обертальних позиційних кодувань, що безпосередньо зменшує інтерференцію сигналу між гетерогенними візуальними токенами зображень і відео. Екстремальне стиснення обчислювальних ресурсів не знизило межу продуктивності. За лише 3 млрд активованих параметрів, продуктивність Lance у генерації та редагуванні зображень і відео перевищує всі існуючі відкриті уніфіковані моделі у більшості тестових наборах, успішно реалізувавши низьковитратний підхід з поєднанням генерації та семантичного розуміння при малих параметрах. (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.