MiniCPM5-1B: штучний інтелект розміром півгігабайта, який запускає агентів на вашому телефоні — і чому це важливо для користувачів криптовалют Новий MiniCPM5-1B від OpenBMB — це модель з одним мільярдом параметрів, створена з нуля для локального запуску на телефонах та інших пристроях з обмеженими ресурсами. Після оптимізації її розмір становить близько півгігабайта — вона не намагається перевершити гігантські моделі, а працює з меншим: забезпечує довгі розмови, виклики інструментів та робочі процеси агентів без хмарного бекенду. Що робить її роботоспроможною: - Розроблена для використання на пристрої: MiniCPM5-1B — перший реліз у сімействі MiniCPM5, спеціально розрахований на вміщення в пам’ять смартфона з підтримкою нативних викликів інструментів та Model Context Protocol (MCP). - Ефективна увага: основа використовує ідеї MiniCPM4 разом із InfLLM v2 — навчальним механізмом уваги, який під час висновування з довгим контекстом порівнює кожен токен лише з менш ніж 5% сусідніх токенів. Це значно зменшує обчислювальну навантаження при мінімальній втраті точності. - Чистіші дані для навчання: Пайплайн UltraClean дозволив команді досягти конкурентоспроможних результатів за допомогою близько 8 трильйонів токенів для навчання (порівняно з 36T, які використовують деякі великі конкуренти). - Пост-навчання: підсилене навчання разом із ефективною дистиляцією від більшої вчителя-моделі підвищило балли на тестах (математика, код, виконання інструкцій) приблизно на 16 балів і зменшило неконтрольовані відповіді на 29 відсотків. - Величезне вікно контексту: 128K токенів (близько 96 000 слів) безперервного контексту роблять збереження пам’яті під час довгих ролевих ігор, резюме документів та тривалих сесій агентів реалістичними навіть на моделі з 1 мільярдом параметрів. Як вона працює Бенчмарки OpenBMB порівнюють MiniCPM5-1B з іншими моделями менше 2 мільярдів параметрів (варіанти Qwen3 від Alibaba та LFM2.5 від Liquid AI). MiniCPM5-1B посідає перше місце у семи категоріях: загальні знання, предметні знання, програмування, виконання інструкцій, математичне мислення, логічне мислення — і найбільш вагомо — агентські завдання та загальні знання. Практичні перевірки: - Логічна пастка: На класичнiй загадці «Чи може чоловiк одружитися з сестрою своєї вдови?» модель сприйняла питання як формальний юридичний запит, а не виявила парадокс. Маленькi моделi все ще пропускають деякi такi хитрi питання. - Вирішальний вибiр: Коли запитали, що домінуватиме в економіці у 2100 році — криптовалюти чи ШІ — модель уникнула чіткої відповіді, що є типовою помилкою малих моделей під тиском діалогу. - Виклики інструментiв: У поєднаннi з сервером MCP MiniCPM5-1B успiшно отримав поточну цiну bitcoin та запропонував правдоподiбнi акцiї (Amazon, Microsoft, Nvidia). Коли дозволено викликати інструменти, галюцинацiї щодо рiдкiсних фактiв значно зменшуються. Чому це важливо для криптовалют: - Локальнi перевiрки цiн та приватнi агенти: MiniCPM5-1B може працювати локально для багатьох завдань — перевiрки балансу гаманця, запиту календаря, резюмування локальних дослiджень або запуску легкого торгового асистента — покращуючи конфiденцiйнiсть та зменшуючи залежнiсть вiд хмарних API. - Агентськi робочi процеси на пристрої: Комбiнацiя викликiв інструментiв + MCP + 128K контексту робить безпечнi, довготривалi агентськi робочi процеси (наприклад, приватний дослiдницький агент, який поєднує локальнi нотатки та актуальнi данi) реалiзованими на смартфонi. - Гiбриднi схеми: Для ширшого охоплення знань або актуальних ринкових даних можна поєднувати модель з сервером MCP для веб-дослiджень; для приватних даних або офлайн-доступу вона може працювати повнiстю локально для багатьох типових завдань. Обмеження та компромiси: - Не замiна великих моделей: MiniCPM5-1B не зможе зрiвнятися з великими моделями за обсягом знань, якiстю генерацiї коду чи складним мисленням. Вона все ще уникатиме чiтких вiдповiдей та галюцинуватиме у деяких випадках, і не наближається до AGI. - Потрiбна налаштування: Запуск агентських робочих процесiв на телефонi потребує деякої конфiгурацiї; OpenBMB опублiкував кроки у своєму GitHub. - Найкращий сценарiй використання: легкi агентськi завдання, довгi розмови чи ролевi ігри, резюмування документiв, офлайн або гiбриднi приватнi робочi процеси. Доступнiсть та сум сумснасть MiniCPM5-1B доступний на Hugging Face за ліцензією Apache 2.0. Вона сумсна з vLLM, SGLang та стандартними стеками інференсу Transformers. Практичний підсумок MiniCPM5-1B не замінить хмарних гігантських моделей для важких завдань, але просуває практичну — і дружню до конфеденційності — категорію ШІ на пристрої. Для користувачів та розробників криптовалют, яким важливий локальний агент, приватний асистент чи мобільні інструменти для торгівлі/досліджень — це значний крок: довгий контекст, виклики інструментів та агентські робочі процеси тепер помишуються у вашому кишеньку.
MiniCPM5-1B: Модель ШІ на пристрої з вікном контексту 128K для користувачів криптовалют
ChainGPTПоділитися






OpenBMB запустив MiniCPM5-1B — AI-модель з 1 мільярдом параметрів для використання безпосередньо на смартфонах. Модель підтримує виклик інструментів, агентські робочі процеси та контекстне вікно з 128K токенів, що робить її ідеальною для аналізу ланцюжків та безпечних криптовалютних завдань. Вона дозволяє користувачам перевіряти ціни та резюмувати дослідження локально. Доступна на Hugging Face за ліцензією Apache 2.0, підтримує як офлайн, так і онлайн-режими. Розробники та користувачі, що цінують конфіденційність, можуть використовувати її для обробки даних ланцюжка без залежності від хмарних сервісів.
Джерело:Показати оригінал
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації.
Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.