ByteDance открывает исходный код Cola DLM: модель диффузии для генерации текста

KuCoinFlash

Время выхода: 16.05.2026, 02:22:20

Сводка

Команда Seed компании ByteDance открыла исходный код Cola DLM — модели диффузии для генерации текста — 16 мая (UTC+8) на основе MetaEra. Модель объединяет Text VAE и блочно-каузальный DiT для генерации текста, сначала организуя высокоуровневую семантику. Открытая версия масштаба 2B содержит 23 миллиарда общих параметров и демонстрирует высокую производительность на восьми тестовых наборах. Это исследовательская точка проверки, а не диалоговая модель, поскольку в ней отсутствует дообучение по инструкциям или RLHF. По мере развития ликвидности и криптовалютных рынков такие модели могут повлиять на усилия по противодействию финансированию терроризма (CFT) за счет улучшения скрининга контента и обнаружения мошенничества.

Согласно новости ME, 16 мая (UTC+8), по данным мониторинга Beating, команда Seed ByteDance открыла исходный код Cola DLM. Это непрерывная скрытая диффузионная языковая модель, которая стремится обойти фиксированный путь посимвольного генерирования текста слева направо, характерный для крупных языковых моделей, и заменить его на процесс, при котором сначала формируется высокий уровень семантики, а затем он детализируется до конкретных слов. Основой Cola DLM является Text VAE + block-causal DiT. Text VAE сначала отображает дискретный текст в непрерывное скрытое пространство, после чего block-causal DiT с помощью Flow Matching обучает скрытый априор, а затем условный декодер восстанавливает текст из скрытых переменных. Процесс диффузии работает с семантическими представлениями, а не с прямым шумоподавлением на уровне токенов. Текущая открытая версия относится к модели уровня 2B, то есть около 2,3 млрд общих параметров, из которых 1,8 млрд приходится на основной DiT и 500 млн — на VAE. В восьми тестах — LAMBADA, MMLU, OBQA, HellaSwag, RACE, SIQA, SQuAD и Story Cloze — в рамках единого протокола генеративной оценки модель демонстрирует масштабируемую производительность, сопоставимую с аналогичными AR/LLaDA-базовыми моделями, и достигает наилучшего среднего результата. Однако на данный момент это исследовательская контрольная точка, а не готовая диалоговая модель. Официально указано, что модель не проходила инструкционную тонкую настройку и RLHF; её основное назначение — исследование применения непрерывных скрытых диффузионных методов для генерации текста. В статье также представлены предварительные эксперименты по расширению на унифицированное моделирование текста и изображений, однако в текущем открытом репозитории содержится только текстовый конвейер. (Источник: BlockBeats)

Источник:Показать оригинал

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.