Moondream ने VLM फाइन-ट्यूनिंग सर्विस Lens को सटीकता में सुधार के लिए लॉन्च किया

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
Moondream ने 21 अप्रैल (UTC+8) को वास्तविक दुनिया के अनुप्रयोगों में सटीकता बढ़ाने के लिए VLM फाइन-ट्यूनिंग सेवा Lens लॉन्च की। Lens एक पेज-एस-यू-गो API है जो प्रबलन सीखने और नियंत्रित फाइन-ट्यूनिंग का समर्थन करता है, और परिणाम दर्जनों छवियों से देखे जा सकते हैं। प्रशिक्षण क्लाउड के माध्यम से या Photon इन्फरेंस इंजन का उपयोग करके स्थानीय रूप से उपलब्ध है। कंपनी ने NBA पहचान, सड़क दृश्य पहचान और ग्लूकोमा वर्गीकरण में सुधारित सटीकता के डेटा को साझा किया। PTZOptics, एक PTZ कैमरा निर्माता, Moondream का उपयोग ट्रैकिंग और अलर्ट के लिए करने वाला पहला साझेदार है। ऑन-चेन समाचार उत्पादन परिवेशों में AI उपकरणों के बढ़ते अपनाए जाने को दर्शाता है। मुद्रास्फीति डेटा क्रिप्टो बाजारों के लिए एक प्रमुख मैक्रो कारक बना हुआ है।

ME समाचार के अनुसार, 21 अप्रैल (UTC+8) को, डोंगचा बीटिंग के अनुसार, Moondream ने लेंस नामक सूक्ष्म-समायोजन सेवा लॉन्च की है, जो विजुअल भाषा मॉडल (VLM, जो छवियाँ पढ़ सकते हैं और पाठ में उत्तर दे सकते हैं) को प्रयोगशाला से उत्पादन में लाने के दौरान सटीकता की समस्या को हल करती है। लेंस एक प्रयोग के आधार पर भुगतान वाला API है, जो प्रबलन सीखने और नियंत्रित सूक्ष्म-समायोजन दोनों का समर्थन करता है; कंपनी के अनुसार, केवल कुछ दर्जन छवियों के नमूने से ही परिणाम दिखाई देते हैं; प्रशिक्षण पूरा होने के बाद, इसे क्लाउड से उपयोग किया जा सकता है या अपने स्वयं के अनुमान इंजन Photon के माध्यम से स्थानीय रूप से चलाया जा सकता है। कंपनी ने तीन सेट तुलनात्मक डेटा प्रकाशित किए हैं। NBA प्रसारण के दृश्यों में बॉल रखने वाले खिलाड़ियों की पहचान करने पर, मूल मॉडल अक्सर कई गलत पहचान के बॉक्स देता है; RL सूक्ष्म-समायोजन के बाद F1 स्कोर 28% से 79% तक बढ़ गया, और गलत सकारात्मक बॉक्स 61 से 2 पर कम हो गए, प्रशिक्षण 54 मिनट में पूरा हुआ, और लागत 16.89 डॉलर। सड़क के दृश्यों में देश की पहचान करने के कार्य में, प्रति देश 25 छवियों के सूक्ष्म-समायोजन नमूनों से सटीकता 71.1% हो गई, GPT-5.4 की 69.8% से अधिक। मेडिकल इमेजिंग में, सूक्ष्म-समायोजित मॉडल की glaucoma की गंभीरता के स्तर की पहचान में सटीकता GPT-5.4 की 2 गुना है, प्रशिक्षण 47 मिनट में पूरा हुआ, और लागत 15.68 डॉलर। पहला सहयोगी PTZOptics है, जो नेटवर्क-नियंत्रित PTZ कैमरों का निर्माण करता है, Moondream का उपयोग विशिष्ट लक्ष्य (जैसे "लाल कपड़े पहने हुए व्यक्ति") का पीछा करने, सामग्री की गिनती करने, और असामान्यता की सूचना देने के लिए किया जा रहा है। Moondream पहले ही Photon अनुमान इंजन प्रकाशित कर 20 मिलीसेकंड की N100 पर प्रसंस्करण देरी का दावा किया है। Lens सटीकता पर केंद्रित है, Photon गति पर, Moondream VLM के उत्पादन में समावेशन के दो सामान्य प्रतिबंधों के हल प्रदान करता है। (स्रोत: BlockBeats)

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।