Циньхуа и Mianbi открывают исходный код первой в мире предварительной обучающей платформы для ИИ-кодирования ForgeTrain
KuCoinFlash
Поделиться
Сводка
Циньхуа и Mianbi открыли исходный код ForgeTrain — первой в мире системы предварительного обучения, написанной с помощью ИИ, для новостей в сфере ИИ и криптовалют. Эта система превосходит Megatron от NVIDIA и повышает скорость на 10% на Huawei Ascend. Также она позволила создать MiniCPM5-1B — один из лучших компактных моделей. Проект демонстрирует потенциал интеграции новостей о реальных активов (RWA) по мере развития инструментов ИИ.
ME AI Новость: согласно мониторингу Beating, компания FaceWall Intelligence и лаборатория NLP Циньхуа совместно открыли исходный код в сообществе OpenBMB первый в мире производственный фреймворк для предварительного обучения крупных моделей, полностью написанный ИИ — ForgeTrain, а также выпустили небольшую модель для краевых устройств MiniCPM5-1B, обученную с помощью ForgeTrain. Как первый пример демонстрации инженерного цикла «ИИ, создающий ИИ», ForgeTrain превзошел по производительности Megatron от NVIDIA при одинаковых аппаратных условиях и достиг ускорения на 10% при предварительном обучении на Huawei Ascend. В то же время MiniCPM5-1B занял первое место в рейтинге открытых малых моделей Artificial Analysis.
Для того чтобы ИИ мог самостоятельно создавать базовую инфраструктуру предварительного обучения, FaceWall Intelligence предложила программную парадигму «Forge Engineering» — отказ от универсальных фреймворков, совместимых со всеми аппаратными платформами и задачами, в пользу использования способности ИИ к низкозатратному генерированию кода для создания специализированного кода под конкретные модели и аппаратные платформы. В архитектуре ForgeTrain применяется трехэтапный подход: сначала из существующих фреймворков для предварительного обучения собираются ключевые данные для формирования тестового стенда (Harness), затем в автоматизированном замкнутом цикле итеративно генерируются бинарно совместимые коды фреймворка, и наконец, ограничения снимаются, достигая превосходства над эталонной реализацией. Вся автоматизированная эволюция соответствует этапам L3–L4 «ИИ, создающего ИИ».
Как первая модель, созданная с помощью ForgeTrain, MiniCPM5-1B имеет 1,08 млрд параметров; ее основная архитектура основана на стандартной LlamaForCausalLM, что значительно снижает порог интеграции и развертывания для нижестоящих задач. В оценках Artificial Analysis модель набрала 18 баллов, превзойдя Qwen3.5-2B с объемом 2 млрд параметров (16 баллов), а также опередила Qwen3.5-0.8B (11 баллов) и LFM2.5-1.2B-Thinking (8 баллов). Модель поддерживает форматы развертывания MLX 4-bit и GGUF Q4_K_M; после квантования INT4 ее вес составляет всего 0,5 ГБ, а также нативно поддерживает длинные контексты до 131 072 токенов и гибридную двухрежимную инференс-логику на основе enable_thinking. Благодаря крайне низким аппаратным требованиям, OpenBMB одновременно открыл исходный код настольного приложения-помощника MiniCPM Desk Pet, работающего полностью в автономном режиме — оно поддерживает реагирование на действия по кодированию в инструментах разработки, таких как Cursor, а также переключение персонажей через LoRA.
(Источник: BlockBeats)
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации.
Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.