LlamaIndex Meluncurkan LiteParse v2.0 yang Ditulis Ulang dengan Rust, Peningkatan Kecepatan Hingga 100x

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
LlamaIndex telah meluncurkan LiteParse v2.0, versi ulang berbasis Rust dari perpustakaan parsing dokumennya. Pembaruan ini meningkatkan kecepatan hingga 100x untuk file kecil dan 3x untuk file besar. Fitur ini mendukung PDF, DOCX, XLSX, dan PPTX, dengan OCR melalui PDFium dan tesseract-rs. Paket asli untuk Python, JavaScript, dan Rust tersedia, bersama dengan dukungan WebAssembly. Altcoin yang perlu diawasi mungkin mendapat manfaat dari peningkatan efisiensi semacam ini. Indeks ketakutan dan keserakahan bisa bereaksi jika adopsi meningkat.
ME AI Berita, menurut pemantauan Beating, LlamaIndex mengumumkan bahwa perpustakaan parsing dokumen open-source LiteParse akan sepenuhnya ditulis ulang menggunakan Rust dan merilis versi 2.0. Parser inti yang direkonstruksi meningkatkan kecepatan hingga 100 kali lebih cepat saat memproses dokumen kecil, serta sekitar 3 kali lebih cepat saat memproses dokumen besar. Rekonstruksi ini bertujuan untuk menyediakan fondasi parsing tata letak lokal, berkecepatan tinggi, dan tanpa ketergantungan pada model besar bagi agen AI dan pipeline Retrieval-Augmented Generation (RAG). LiteParse 2.0 tetap mempertahankan desain lokal tanpa ketergantungan pada model besar, mengintegrasikan cabang PDFium yang disesuaikan secara mendalam untuk analisis tata letak spasial, serta menggabungkan pustaka tesseract-rs untuk mengimplementasikan fungsi Optical Character Recognition (OCR) secara lokal. Alat ini saat ini mendukung PDF serta dokumen Office seperti DOCX, XLSX, dan PPTX. Parser memproyeksikan teks secara spasial dua dimensi sesuai tata letak dokumen, menghasilkan teks terstruktur yang mempertahankan hubungan posisi dan tata letak, sehingga menyediakan konteks lokasi dan referensi berpresisi tinggi untuk model besar dengan konsumsi daya sangat rendah. Dalam hal integrasi dan distribusi ekosistem, LlamaIndex menyediakan dukungan paket asli untuk berbagai runtime utama. Pengembang dapat dengan cepat mengintegrasikannya ke dalam alur kerja melalui pip install liteparse di Python, npm i @llamaindex/liteparse di JavaScript, atau Cargo di Rust. Berkat pembangunan berbasis Rust di lapisan bawah, versi baru ini dapat dikompilasi ke format WebAssembly, membuka kemampuan berjalan lokal di browser dan node edge computing. Perlu dicatat bahwa karena keterbatasan lingkungan eksekusi, fungsi OCR di lingkungan WebAssembly tidak disertakan secara bawaan; pengembang perlu mengimplementasikan pemindaian file melalui callback eksternal (misalnya dengan memanggil tesseract.js). (Sumber: BlockBeats)
Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.