Moondream запускає сервіс налаштування VLM Lens для покращення точності

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Moondream запустила сервіс тонкої настройки VLM під назвою Lens 21 квітня (UTC+8) для підвищення точності у реальних застосуваннях. Lens — це API за принципом «плати за використання», який підтримує підсилене навчання та наглядову тонку настройку, з результатами, видимими з дюжини зображень. Навчання доступне через хмару або локально за допомогою інференс-движка Photon. Компанія поділилася даними, що демонструють покращену точність у виявленні NBA, розпізнаванні вуличних сцен та класифікації глаукоми. PTZOptics, виробник PTZ-камер, є першим партнером, який використовує Moondream для відстеження та сповіщень. Новини у блокчейні підкреслюють зростаюче впровадження інструментів ШІ у виробничих середовищах. Дані про інфляцію залишаються ключовим макрофактором для крипторинків.

Новини ME, 21 квітня (UTC+8): за даними моніторингу Beating, Moondream запустила сервіс тонкої настройки Lens, щоб вирішити проблему «останнього кілометра» — низьку точність візуальних мовних моделей (VLM, які можуть читати зображення та відповідати текстом) при переході з лабораторії до виробництва. Lens — це API за використанням, який підтримує підсилене навчання та наглядову тонку настройку; за словами розробників, ефект видно вже на зразку з кількох десятків зображень. Після навчання модель можна викликати через хмару або запускати локально за допомогою власного інференс-движка Photon. Компанія опублікувала три групи порівняльних даних. У виявленні гравця з м’ячем у кадрі прямих трансляцій NBA базова модель часто генерувала велику кількість хибних рамок; після тонкої настройки за допомогою RL F1-показник зрос з 28% до 79%, кількість хибних сповіщень зменшилася з 61 до 2, час навчання — 54 хвилини, витрати — 16,89 долара США. У завданні визначення країни за зображеннями вулиць 25 зображень на країну дозволили досягти точності 71,1%, що перевищує 69,8% GPT-5.4. У сфері медичної візуалізації точність класифікації ступеня тяжкості глаукоми після тонкої настройки вдвічі перевищує показник GPT-5.4, час навчання — 47 хвилин, витрати — 15,68 долара США. Першим партнером є виробник хмарних панорамних камер із дистанційним керуванням PTZOptics, який використовує Moondream для відстеження конкретних об’єктів (наприклад, «людина у червоному одязі»), підрахунку елементів на зображенні та сповіщень про аномалії. Раніше Moondream представила інференс-движок Photon, який, за офіційними даними, має затримку 20 мс на H100. Lens зосереджений на точності, а Photon — на швидкості; Moondream запропонувала розв’язання для двох найпоширеніших бар’єрів при впровадженні VLM у виробництво. (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.