Surya OCR 2, 6,5 milyar parametre ile %83,3 doğruluk oranı sağlayarak yeni bir standart belirliyor

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
Zincir içi analiz, Datalab'ın 28 Mayıs'ta (UTC+8) Surya OCR 2'yi başlatmasıyla belge akıllılığına yönelik ilginin arttığını gösteriyor. Model, 6,5 milyar parametre ile olmOCR-bench üzerinde %83,3 doğruluk oranı sağlıyor ve 90 milyar parametreli versiyonunu geride bırakıyor. 91 dilini destekleyen model, bir VLM içinde düzen, metin ve tablo tanıma işlevlerini yerine getiriyor. Zincir içi veriler, RTX 5090 üzerinde saniyede 5,35 sayfa ve M1 cihazlarda tamamen yerel işlem yapabildiğini ortaya koyuyor. Kod, Apache 2.0 lisansı altında açık kaynaklıdır ve 5 milyon doların altındaki gelire sahip girişimlere ücretsiz ağırlıklar sunulmaktadır. Datalab, aynı zamanda 40 milyar parametreli Chandra 2 modeli için ücretli bir API sunuyor ve $5 değerinde deneme kredisi veriyor.

ME Haberleri'ne göre, 28 Mayıs'ta (UTC+8), Beating tarafından izlenen verilere göre, açık kaynaklı belge akıllılık platformu Datalab, yeni çok dilli OCR açık kaynak modeli Surya OCR 2'yi resmen duyurdu. Yeni model, yalnızca 650 milyon parametre ile yetkili belge akıllılık testi olmOCR-bench'te %83,3 puan aldı ve 3 milyar parametreden düşük kategoride birinci oldu; performansı, yaklaşık 14 kat daha büyük olan ilk nesil 9 milyar parametreli sürümü bile geçti ve parametre sayısı ile doğruluk arasında Pareto optimalliğini sağladı. Fonksiyonel olarak, Surya OCR 2, sayfa analizi, metin tanıma ve tablo tanıma gibi üç ana görevi tek bir görsel dil modeline (VLM) entegre ederken, metin satırı tespiti ve OCR hata denetimi hâlâ bağımsız hafif modellerle çalışır. Kullanıcılar, tek bir model çağrısıyla tam sayfa OCR tanımasını gerçekleştirir ve koordinat kutuları ve okuma sırasını içeren yapılandırılmış HTML kodu alır; matematik formülleri HTML math etiketleriyle, satır ve liste arası tablolar ise standart HTML formatına dönüştürülür. Çok dilli destek açısından, yeni model 91 dilde %87,2 toplam geçme oranı elde etti (Çince geçme oranı %82,5) ve hasarlı belgeler ile el yazısı için derin optimizasyonlar uygulandı. Dağıtım verimliliği açısından, Surya OCR 2 iki farklı çıkarım arka ucunu destekler. Sistem, NVIDIA GPU cihazlarında Docker ile çalıştırıldığında vLLM arka ucu etkinleştirilerek tek bir RTX 5090 ekran kartıyla saniyede 5,35 sayfa yüksek verimlilik sağlar. Apple cihazlarında veya normal CPU ortamlarında sistem, llama.cpp ile GGUF formatını yükleyerek M1 bilgisayarlarda tamamen yerel olarak çalışır. Şu anda yeni modelin kaynak kodu Apache 2.0 lisansı altında açık kaynaklıdır ve ağırlıklar, OpenRAIL-M lisansı altında bireysel kullanıcılar, üniversite kurumları ve yıllık geliri 5 milyon ABD dolarının altında olan girişimlere ücretsiz olarak sunulmaktadır. Datalab resmi ayrıca daha güçlü 4 milyar parametreli Chandra 2 modelini içeren ücretli API'yi aynı anda açtı ve 5 ABD doları değerinde ücretsiz deneme kredisi verdi. (Kaynak: BlockBeats)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.