ME समाचार के अनुसार, 28 मई (UTC+8) को, डेटा चेक Beating के अनुसार, ओपन सोर्स दस्तावेज़ बुद्धिमत्ता प्लेटफॉर्म Datalab ने नया बहुभाषी OCR ओपन सोर्स मॉडल Surya OCR 2 लॉन्च किया है। नया मॉडल केवल 6.5 अरब पैरामीटर्स के साथ, प्रतिष्ठित दस्तावेज़ बुद्धिमत्ता मूल्यांकन olmOCR-bench में 83.3% का स्कोर प्राप्त करता है और 30 अरब पैरामीटर्स से कम श्रेणी में पहले स्थान पर है, जिसका प्रदर्शन लगभग 14 गुना बड़े 90 अरब पैरामीटर्स वाले प्रारंभिक संस्करण से भी बेहतर है, जिससे पैरामीटर संख्या और सटीकता में पेटो-अप्टिमलिटी प्राप्त होती है। कार्यों के मामले में, Surya OCR 2 ने लेआउट विश्लेषण, पाठ पहचान और टेबल पहचान जैसे तीन मुख्य कार्यों को एकल विजुअल भाषा मॉडल (VLM) में समेट दिया है, जबकि पाठ पंक्ति संसाधन और OCR त्रुटि संसाधन अभी भी स्वतंत्र हल्के मॉडल के माध्यम से चलते हैं। उपयोगकर्ता एकल मॉडल कॉल के माध्यम से पूरे पृष्ठ की OCR पहचान कर सकते हैं, और कोऑर्डिनेट बॉक्स और पठन क्रम सहित संरचित HTML कोड प्राप्त करते हैं, जहां गणितीय सूत्र HTML math टैग के माध्यम से प्रदर्शित किए जाते हैं, और क्रॉस-लाइन, क्रॉस-कॉलम टेबल को मानक HTML प्रारूप में संगठित किया जाता है। बहुभाषी समर्थन के मामले में, नए मॉडल ने 91 भाषाओं के परीक्षण में 87.2% की समग्र सफलता दर (चीनी के लिए 82.5%) प्राप्त की है, और क्षतिग्रस्त दस्तावेज़ों और हस्तलिखित पाठ के लिए गहन अनुकूलन किया गया है। प्रस्थापन कुशलता के मामले में, Surya OCR 2 दो प्रमुख निष्पादन बैकएंड का समर्थन करता है। सिस्टम NVIDIA GPU पर Docker के साथ vLLM बैकएंड सक्रिय करके चलता है, RTX 5090 GPU पर 5.35 पेज/सेकंड की अति-उच्च संसाधन क्षमता प्राप्त होती है। Apple डिवाइस या सामान्य CPU पर, सिस्टम llama.cpp के माध्यम से GGUF प्रारूप लोड करता है, M1 कंप्यूटर पर पूरी तरह से स्थानीय क्लाइंट-साइड चलाने की सुविधा प्रदान करता है। वर्तमान में, नए मॉडल का स्रोत कोड Apache 2.0 लाइसेंस के अधीन ओपन सोर्स है, और वजन OpenRAIL-M लाइसेंस के अधीन व्यक्तिगत, शिक्षण संस्थानों, और 500 मिलियन USD से कम वार्षिक आय वाली स्टार्टअप के लिए मुफ़्त है। Datalab की आधिकारिक वेबसाइट पर Chandra 2 मॉडल (40 अरब पैरामीटर) के साथ सशुल्क API कोई समय-समय पर प्रदान किया है, साथ ही 5 USD का प्रयोगकर्ता प्रयोग क्रेडिट प्रदान किया है। (स्रोत: BlockBeats)
Surya OCR 2, 6.5B पैरामीटर के साथ 83.3% सटीकता प्राप्त करता है, नया बेंचमार्क स्थापित करता है
KuCoinFlashसाझा करें






ऑन-चेन विश्लेषण दर्शाता है कि डॉक्यूमेंट इंटेलिजेंस में बढ़ती दिलचस्पी है, जबकि Datalab 28 मई (UTC+8) को Surya OCR 2 लॉन्च करता है। यह मॉडल 6.5B पैरामीटर के साथ olmOCR-bench पर 83.3% सटीकता प्राप्त करता है और अपने 90B-पैरामीटर संस्करण से बेहतर प्रदर्शन करता है। 91 भाषाओं का समर्थन करते हुए, यह एक VLM में लेआउट, टेक्स्ट और टेबल पहचान को संभालता है। ऑन-चेन डेटा के अनुसार, RTX 5090 पर 5.35 पृष्ठ प्रति सेकंड और M1 डिवाइस पर पूर्ण स्थानीय संचालन होता है। कोड Apache 2.0 के तहत ओपन-सोर्स किया गया है, और $5M राजस्व से कम के स्टार्टअप्स के लिए मुफ्त वजन उपलब्ध हैं। Datalab Chandra 2 मॉडल (40B पैरामीटर) के लिए एक पेड API भी प्रदान करता है, जिसमें $5 का ट्रायल क्रेडिट शामिल है।
स्रोत:मूल दिखाएं
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।