ByteDance открывает исходный код мультимодельной модели Lance с 3 млрд параметров, обученной на 128 GPU A100

iconKuCoinFlash
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
ByteDance открыла исходный код своего мультимодального модели с 3 млрд параметров Lance 19 мая, обученного на 128 GPU A100. Модель обрабатывает задачи изображений и видео в одной системе. Данные в блокчейне показывают рост открытого интереса к криптовалютным проектам на основе ИИ. Lance использует двухпотоковую архитектуру MoE и модальностно-осознанное вращательное кодирование для снижения затрат при сохранении высокой производительности. Открытый интерес к токенам, связанным с ИИ, стабильно растет в этом квартале.

Согласно новости ME, 19 мая (UTC+8), по данным мониторинга Beating, ByteDance Research официально открыла исходный код нативной унифицированной многомодальной большой модели Lance. Это легковесная модель с активными параметрами всего 3B, которая в рамках единой архитектуры поддерживает понимание, генерацию и редактирование изображений и видео. В отличие от современных унифицированных моделей, которые сильно полагаются на увеличение объема параметров или использование архитектур текст-в-изображение, Lance реализовал путь совместной работы при крайне низких вычислительных затратах. Команда разработчиков полностью обучила модель с нуля и сократила общий вычислительный бюджет всего до 128 GPU A100. Для решения внутренних конфликтов между различными модальностями и задачами Lance внедрил две жесткие изоляции в архитектуре: - Применение двойного потока с гибридной архитектурой MoE для обработки переплетенных многомодальных последовательностей, обеспечивая совместное использование нижнего контекста при разделении вычислительных путей понимания и генерации. - Внедрение модальностно-осознанного вращающегося позиционного кодирования, напрямую ослабляющего помехи между гетерогенными визуальными токенами изображений и видео. Экстремальное сжатие вычислительных ресурсов не снизило потенциал производительности. При всего 3B активных параметрах Lance демонстрирует превосходство в генерации и редактировании изображений и видео на большинстве тестовых наборов по сравнению с существующими открытыми унифицированными моделями, успешно реализовав низкозатратный путь, сочетающий генерацию и семантическое понимание при малом объеме параметров. (Источник: BlockBeats)

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.