Surya OCR 2, 6.5B पैरामीटर के साथ 83.3% सटीकता प्राप्त करता है, नया बेंचमार्क स्थापित करता है

ME समाचार के अनुसार, 28 मई (UTC+8) को, डेटा चेक Beating के अनुसार, ओपन सोर्स दस्तावेज़ बुद्धिमत्ता प्लेटफॉर्म Datalab ने नया बहुभाषी OCR ओपन सोर्स मॉडल Surya OCR 2 लॉन्च किया है। नया मॉडल केवल 6.5 अरब पैरामीटर्स के साथ, प्रतिष्ठित दस्तावेज़ बुद्धिमत्ता मूल्यांकन olmOCR-bench में 83.3% का स्कोर प्राप्त करता है और 30 अरब पैरामीटर्स से कम श्रेणी में पहले स्थान पर है, जिसका प्रदर्शन लगभग 14 गुना बड़े 90 अरब पैरामीटर्स वाले प्रारंभिक संस्करण से भी बेहतर है, जिससे पैरामीटर संख्या और सटीकता में पेटो-अप्टिमलिटी प्राप्त होती है। कार्यों के मामले में, Surya OCR 2 ने लेआउट विश्लेषण, पाठ पहचान और टेबल पहचान जैसे तीन मुख्य कार्यों को एकल विजुअल भाषा मॉडल (VLM) में समेट दिया है, जबकि पाठ पंक्ति संसाधन और OCR त्रुटि संसाधन अभी भी स्वतंत्र हल्के मॉडल के माध्यम से चलते हैं। उपयोगकर्ता एकल मॉडल कॉल के माध्यम से पूरे पृष्ठ की OCR पहचान कर सकते हैं, और कोऑर्डिनेट बॉक्स और पठन क्रम सहित संरचित HTML कोड प्राप्त करते हैं, जहां गणितीय सूत्र HTML math टैग के माध्यम से प्रदर्शित किए जाते हैं, और क्रॉस-लाइन, क्रॉस-कॉलम टेबल को मानक HTML प्रारूप में संगठित किया जाता है। बहुभाषी समर्थन के मामले में, नए मॉडल ने 91 भाषाओं के परीक्षण में 87.2% की समग्र सफलता दर (चीनी के लिए 82.5%) प्राप्त की है, और क्षतिग्रस्त दस्तावेज़ों और हस्तलिखित पाठ के लिए गहन अनुकूलन किया गया है। प्रस्थापन कुशलता के मामले में, Surya OCR 2 दो प्रमुख निष्पादन बैकएंड का समर्थन करता है। सिस्टम NVIDIA GPU पर Docker के साथ vLLM बैकएंड सक्रिय करके चलता है, RTX 5090 GPU पर 5.35 पेज/सेकंड की अति-उच्च संसाधन क्षमता प्राप्त होती है। Apple डिवाइस या सामान्य CPU पर, सिस्टम llama.cpp के माध्यम से GGUF प्रारूप लोड करता है, M1 कंप्यूटर पर पूरी तरह से स्थानीय क्लाइंट-साइड चलाने की सुविधा प्रदान करता है। वर्तमान में, नए मॉडल का स्रोत कोड Apache 2.0 लाइसेंस के अधीन ओपन सोर्स है, और वजन OpenRAIL-M लाइसेंस के अधीन व्यक्तिगत, शिक्षण संस्थानों, और 500 मिलियन USD से कम वार्षिक आय वाली स्टार्टअप के लिए मुफ़्त है। Datalab की आधिकारिक वेबसाइट पर Chandra 2 मॉडल (40 अरब पैरामीटर) के साथ सशुल्क API कोई समय-समय पर प्रदान किया है, साथ ही 5 USD का प्रयोगकर्ता प्रयोग क्रेडिट प्रदान किया है। (स्रोत: BlockBeats)