ME نیوز کے مطابق، 28 مئی (UTC+8) کو،動察 Beating کی نگرانی کے مطابق، اوپن سورس ڈاکیومنٹ انسٹیلینس پلیٹ فارم Datalab نے نئے متعدد زبانوں والے OCR اوپن سورس ماڈل Surya OCR 2 کا اعلان کیا ہے۔ نیا ماڈل صرف 6.5 ارب پیرامیٹرز کے ساتھ، اہم ڈاکیومنٹ انسٹیلینس ایوان olmOCR-bench میں 83.3% کا اسکور حاصل کیا، جس میں 30 ارب پیرامیٹرز سے کم والے کیٹیگری میں ٹاپ پوزیشن حاصل کی۔ اس کی کارکردگی تقریباً 14 گنا بڑے ابتدائی 90 ارب پیرامیٹرز والے ورژن سے بھی بہتر ہے، جس سے پیرامیٹر کی مقدار اور درستگی کے درمیان پیریٹو آپٹیمزم حاصل ہوا۔ فنکشنل طور پر، Surya OCR 2 نے لیآؤٹ اینالسس، ٹیکسٹ ریکگنشن اور ٹیبل ریکگنشن جیسے تین اہم کاموں کو ایک منفرد وژول لینگوئج ماڈل (VLM) میں شامل کر دیا ہے، جبکہ ٹیکسٹ لائن ڈیٹیکشن اور OCR غلطیوں کی تشخیص اب بھی الگ الگ ہلکے ماڈلز کے ذریعے چل رہے ہیں۔ صارفین ایک منفرد ماڈل کال کے ذریعے پورے صفحے کا OCR شناخت کر سکتے ہیں، جس سے کوآرڈینیٹ باکس اور ریڈنگ آرڈر کے ساتھ سٹرکچرڈ HTML کوڈ ملتا ہے، جہاں ریاضی کے فارمولوں کو HTML math ٹیگز کے ذریعے اور عبور لائن/کالم ٹیبلز کو معیاری HTML فارمیٹ میں ترتیب دیا جاتا ہے۔ متعدد زبانوں کے حوالے سے، نئے ماڈل نے 91 زبانوں کے ٹیسٹ میں 87.2% کل مجموعی پاس ریٹ حاصل کیا (چینی زبان کا پاس ریٹ 82.5% ہے)، اور خراب ڈاکومینٹس اور ہاتھ سے لکھے ہوئے متن کو بھی گہرا بہتر بنایا گيا ہے۔ ڈپلومنٹ کارکردگی کے حوالے سے، Surya OCR 2 دو رینینگ باکنڈز کو سپورٹ کرتا ہے۔ جب نظام نوڈس GPU ڈوائس پر Docker چلا کر vLLM باکنڈ استعمال کرتا ہے، تو ایک RTX 5090 GPU پر فی سیکنڈ 5.35 صفحات کا بہت زبردست تھروٹل ریٹ حاصل ہوتا ہے۔ اپل ڈوائسز یا عام CPU ماحول میں، نظام llama.cpp کے ذریعہ GGUF فارمیٹ لوڈ کرتا ہے، جس سے M1 کمپوٹر پر مکمل طور پر لوکل انڈ-دسترس تک رسائی حاصل ہوتی ہے۔ موجودہ میں، نئے ماڈل کا سورس کوڈ Apache 2.0 لائسنس کے تحت اوپن سورس ہے، اور وزن OpenRAIL-M لائسنس کے تحت انفرادی صارفین، تعلیمی اداروں، اور سالانہ آمدنی 5 ملین امریکی ڈالر سے کم والے اسٹارٹ اپس کے لئے مفت دستاویزات فراہم کئے جاتے ہیں۔ Datalab نے اپنے پرائم رنگ Chandra 2 ماڈل (40 ارب پیرامیٹرز) والا فائدہ مند API بھي فراہم کرنے کا اعلان کرتے ہوئے، 5 امریکی ڈالر کا تجرباتي رعایت بھي دینا شروع کردیا ہے۔ (ذرائع: BlockBeats)
سوریا OCR 2، 6.5B پیرامیٹرز کے ساتھ 83.3% درستگی حاصل کرتا ہے، نیا بینچ مارک قائم کرتا ہے
KuCoinFlashبانٹیں






آن-چین تجزیہ ظاہر کرتا ہے کہ دستاویزات کی ذہانت میں دلچسپی بڑھ رہی ہے جبکہ Datalab نے 28 مئی (UTC+8) کو Surya OCR 2 جاری کیا۔ یہ ماڈل 6.5 ارب پیرامیٹرز کے ساتھ olmOCR-bench پر 83.3% درستگی حاصل کرتا ہے، جو اس کے 90 ارب پیرامیٹرز والے ورژن سے بہتر ہے۔ یہ 91 زبانوں کی حمایت کرتا ہے اور ایک VLM میں لے آؤٹ، متن اور جدول کی شناخت کرتا ہے۔ آن-چین ڈیٹا کے مطابق، RTX 5090 پر 5.35 صفحات فی سیکنڈ اور M1 ڈیوائسز پر مکمل لوکل آپریشن ممکن ہے۔ کوڈ Apache 2.0 کے تحت اوپن سورس کیا گیا ہے، اور $5 ملین سے کم آمدنی والے اسٹارٹ اپس کے لیے مفت وزن دستیاب ہیں۔ Datalab اپنے 40 ارب پیرامیٹرز والے Chandra 2 ماڈل کے لیے ایک مفت تجربہ کریڈٹ $5 کے ساتھ ایک ادائیگی والی API بھی فراہم کرتا ہے۔
ذریعہ:اصل دکھائیں۔
اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔
ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔