Університет Цінхуа та Mianbi відкрили світовий перший підготовчий фреймворк для штучного інтелекту з кодуванням ForgeTrain
KuCoinFlash
Поділитися
Короткий зміст
Університет Цінхуа та Mianbi відкрили джерела ForgeTrain — першу у світі передтренувальну рамку, написану штучним інтелектом, для новин про AI та криптовалюти. Ця рамка перевершує NVIDIA Megatron і збільшує швидкість на 10% на Huawei Ascend. Вона також створила MiniCPM5-1B — один із найкращих компактних моделей. Проект підкреслює потенціал інтеграції новин про реальні активи (RWA) зі зростанням інструментів штучного інтелекту.
ME AI Новина: за даними моніторингу Beating, Beibei Intelligence та лабораторія NLP Цинхуа у співпраці зі спільнотою OpenBMB запустили першу у світі продуктивну систему попереднього навчання великих моделей, повністю створену штучним інтелектом — ForgeTrain, а також випустили невелику модель для кінцевих пристроїв MiniCPM5-1B, навчену за допомогою ForgeTrain. Як перший приклад енжинерного циклу «AI створює AI», ForgeTrain продемонстрував перевагу над Megatron від NVIDIA за тих самих умов обладнання, а також досяг 10% прискорення під час попереднього навчання на Huawei Ascend. Крім того, MiniCPM5-1B посів перше місце у рейтингу відкритих вагових малих моделей Artificial Analysis.
Щоб дозволити штучному інтелекту самостійно будувати базову інфраструктуру попереднього навчання, Beibei Intelligence запровадила програмну парадигму «Forge Engineering» — вона відмовляється від універсальних фреймворків, сумісних з усіма апаратними платформами та завданнями, і замість цього використовує здатність AI до низьковитратного генерування коду для створення спеціалізованих кодів для конкретних моделей та апаратних рішень. У своїй архітектурі ForgeTrain застосовує триетапний підхід: спочатку збирає ключові дані з існуючих фреймворків попереднього навчання, формуючи тестову арену (Harness), потім ітеративно генерує бінарно-консистентний код фреймворку в автоматичному замкненому циклі, і нарешті видаляє обмеження, досягаючи переваги над еталонною реалізацією. Цей автоматизований процес відповідає етапам L3–L4 «AI створює AI».
Як перша модель, створена за допомогою ForgeTrain, MiniCPM5-1B має 1,08 мільярда параметрів і базується на стандартній архітектурі LlamaForCausalLM, що значно знижує бар’єри для інтеграції та розгортання в нижніх рівнях. У тестах Artificial Analysis модель набрала 18 балів, перевершивши Qwen3.5-2B (16 балів) з розміром 2B, а також Qwen3.5-0.8B (11 балів) і LFM2.5-1.2B-Thinking (8 балів). Модель підтримує формати розгортання MLX 4-bit та GGUF Q4_K_M; після INT4 квантування її ваги становлять лише 0,5 ГБ, а також нативно підтримує довгий контекст до 131 072 токенів і гибридний двомодальний висновок на основі enable_thinking. Завдяки надзвичайно низьким вимогам до обладнання, OpenBMB одночасно випустив десктопний застосунок MiniCPM Desk Pet — автономний настільний додаток-помічник, який підтримує реальний час відповідей на діяльність у розробницьких інструментах, таких як Cursor, а також переключення особистостей за допомогою LoRA.
(Джерело: BlockBeats)
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації.
Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.