Berita ME, 28 Mei (UTC+8), menurut pemantauan Beating, platform dokumen pintar sumber terbuka Datalab secara rasmi melancarkan model OCR sumber terbuka multibahasa baharu, Surya OCR 2. Model baharu ini hanya mempunyai 650 juta parameter, mencapai skor 83.3% dalam penilaian dokumen pintar berwibawa olmOCR-bench, menempati kedudukan pertama dalam kelas di bawah 3 bilion parameter, dengan prestasi bahkan melebihi versi asal 9 bilion parameter yang berukuran kira-kira 14 kali ganda, mencapai optimalisasi Pareto antara jumlah parameter dan ketepatan. Dari segi fungsi, Surya OCR 2 menggabungkan tiga tugas utama—analisis tata letak, pengenalan teks, dan pengenalan jadual—ke dalam satu model bahasa visual (VLM) tunggal, sementara pengesanan baris teks dan pengesanan kesilapan OCR masih dijalankan melalui model ringan yang berdiri sendiri. Pengguna boleh menyelesaikan pengenalan OCR penuh halaman dengan sekali panggilan model, menghasilkan kod HTML berstruktur yang mengandungi kotak koordinat dan urutan bacaan, di mana formula matematik dikeluarkan dalam tag HTML math, dan jadual lintas baris dan lintas senarai disusun dalam format HTML piawai. Dari segi sokongan multibahasa, model baharu ini mencapai kadar lulus komprehensif 87.2% dalam ujian 91 bahasa (kadar lulus bahasa Cina 82.5%), serta dioptimakan secara mendalam untuk dokumen rosak dan tulisan tangan. Dari segi kecekapan pelaksanaan, Surya OCR 2 menyokong dua backend inferens. Sistem berjalan di peranti GPU NVIDIA dengan Docker dan backend vLLM yang diaktifkan, membolehkan satu kad RTX 5090 mencapai kadar throughput tinggi 5.35 halaman per saat. Di peranti Apple atau persekitaran CPU biasa, sistem menggunakan llama.cpp untuk memuatkan format GGUF, membolehkan pelaksanaan sepenuhnya di sisi peranti pada komputer M1. Semasa ini, kod sumber model baharu ini dibuka secara sumber terbuka berdasarkan lesen Apache 2.0, dan bobotnya disediakan secara percuma berdasarkan lesen OpenRAIL-M kepada individu, institusi akademik, dan perusahaan permulaan dengan pendapatan tahunan di bawah 5 juta dolar AS. Datalab rasmi juga secara serentak membuka API berbayar yang dilengkapi model Chandra 2 4 bilion parameter yang lebih kuat, serta memberikan kredit percubaan sebanyak 5 dolar AS. (Sumber: BlockBeats)
Surya OCR 2 mencapai ketepatan 83.3% dengan 6.5B parameter, menetapkan tolok ukur baharu
KuCoinFlashKongsi






Analisis di atas rantai menunjukkan minat yang semakin meningkat terhadap kecerdasan dokumen semasa Datalab melancarkan Surya OCR 2 pada 28 Mei (UTC+8). Model ini mencapai ketepatan 83.3% pada olmOCR-bench dengan 6.5B parameter, melebihi versi 90B-parameternya. Menyokong 91 bahasa, ia menangani pengenalan layout, teks, dan jadual dalam satu VLM. Data di atas rantai menunjukkan 5.35 muka surat per saat pada RTX 5090 dan operasi penuh secara tempatan pada peranti M1. Kod dibuka secara percuma di bawah Apache 2.0, dengan berat percuma untuk permulaan dengan pendapatan di bawah $5 juta. Datalab juga menawarkan API berbayar untuk model Chandra 2 40B-parameternya dengan kredit percubaan $5.
Sumber:Tunjukkan artikel asal
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini.
Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.