Moondream 推出 VLM 微調服務 Lens 以提升準確性

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Moondream 於 4 月 21 日(UTC+8)推出名為 Lens 的 VLM 微調服務,以提升現實應用中的準確性。Lens 是一種按使用付費的 API,支援強化學習與監督式微調,僅需十幾張圖片即可看到結果。訓練可透過雲端或使用 Photon 推理引擎在本地進行。公司分享的數據顯示,其在 NBA 檢測、街景識別和青光眼分類方面的準確性均有提升。PTZ 攝像頭製造商 PTZOptics 是首家使用 Moondream 進行追蹤與警報的合作伙伴。鏈上新聞凸顯了 AI 工具在生產環境中的採用日益增加。通脹數據仍是加密貨幣市場的關鍵宏觀因素。

ME News 消息,4 月 21 日(UTC+8),據動察 Beating 監測,Moondream 上線微調服務 Lens,解決視覺語言模型(VLM,能讀圖並用文字回答的 AI 模型)從實驗室走向生產時準確度不足的「最後一公里」問題。Lens 是按量付費 API,同時支援強化學習和監督微調,官方稱僅需十幾張圖的樣本就能看到效果;訓練完成後可透過雲端調用,也可用自家推理引擎 Photon 本地運行。公司公開了三組對比數據。在 NBA 直播畫面中檢測持球球員,基礎模型經常產生大量誤檢框;使用 RL 微調後 F1 從 28% 提升至 79%,誤報框從 61 個降至 2 個,訓練耗時 54 分鐘、費用 16.89 美元。在街景照片識別所在國家的任務中,每國 25 張微調樣本使準確率達到 71.1%,超過 GPT-5.4 的 69.8%。在醫學影像方面,微調後模型對青光眼嚴重程度分級的準確度是 GPT-5.4 的 2 倍,訓練 47 分鐘、花費 15.68 美元。首個合作方是製作網路遙控雲台攝像機的廠商 PTZOptics,將 Moondream 用於追蹤特定目標(例如「穿紅衣服的人」)、畫面內容清點和異常告警。Moondream 此前已發布推理引擎 Photon,官方數字為在 H100 上 20 毫秒推理延遲。Lens 主攻準確度,Photon 主攻速度,Moondream 對 VLM 生產落地的兩個常見瓶頸均提出了方案。(來源:BlockBeats)

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露