LlamaIndex melancarkan LiteParse v2.0 yang ditulis semula dalam Rust, peningkatan kelajuan sehingga 100x

iconKuCoinFlash
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
LlamaIndex telah melancarkan LiteParse v2.0, penulisan semula pustaka pemeriksaan dokumen berdasarkan Rust. Kemas kini ini meningkatkan kelajuan sehingga 100x untuk fail kecil dan 3x untuk fail besar. Ia menyokong PDF, DOCX, XLSX, dan PPTX, dengan OCR melalui PDFium dan tesseract-rs. Paket asli untuk Python, JavaScript, dan Rust tersedia, bersama sokongan WebAssembly. Altcoin yang perlu dipantau mungkin mendapat keuntungan daripada peningkatan kecekapan seperti ini. Indeks ketakutan dan keserakahan mungkin bereaksi jika penggunaan meningkat.
ME AI mesej, menurut pemantauan Beating, LlamaIndex mengumumkan bahawa perpustakaan pemecah dokumen sumber terbuka LiteParse akan ditulis semula sepenuhnya menggunakan Rust dan dilancarkan dalam versi 2.0. Pemecah utama yang dibina semula menunjukkan peningkatan kelajuan sehingga 100 kali ganda apabila memproses dokumen kecil, dan hampir tiga kali ganda untuk dokumen besar. Rekabentuk semula ini bertujuan untuk menyediakan asas pemecahan ruang tempatan, pantas, dan tanpa perlunya memanggil model besar untuk agen AI dan saluran Retrieval-Augmented Generation (RAG). LiteParse 2.0 terus mempertahankan reka bentuk pelaksanaan tempatan tanpa bergantung kepada model besar, mengintegrasikan cabang PDFium yang disesuaikan secara mendalam untuk analisis tata letak ruang, serta menggabungkan pustaka tesseract-rs untuk melaksanakan pengiktirafan karakter optik (OCR) secara tempatan. Alat ini kini menyokong PDF serta dokumen Office termasuk DOCX, XLSX, dan PPTX. Pemecah ini memproyeksikan teks mengikut tata letak dokumen dalam dimensi dua, menghasilkan teks berstruktur yang mengekalkan hubungan posisi dan tata letak, untuk memberikan konteks rujukan dan lokasi yang tepat kepada model besar dengan penggunaan kuasa yang sangat rendah. Dari segi integrasi dan pengedaran ekosistem, LlamaIndex menyediakan sokongan pakej asli untuk pelbagai runtime utama. Pembangun boleh dengan cepat mengintegrasikan alat ini ke dalam alur kerja mereka melalui pip install liteparse dalam Python, npm i @llamaindex/liteparse dalam JavaScript, atau melalui repositori Cargo dalam Rust. Disebabkan penggunaan Rust di peringkat bawah, versi baharu ini mampu dikompilasi ke format WebAssembly, membuka kemampuan pelaksanaan tempatan di peranti pelayar dan nod pengiraan pinggir. Perlu ditekankan bahawa, disebabkan sekatan persekitaran pelaksanaan, fungsi OCR dalam persekitaran WebAssembly tidak disertakan secara dalaman; pembangun perlu mengimplantasinya melalui panggilan balik luaran (contohnya, memanggil tesseract.js) untuk pemindai fail. (Sumber: BlockBeats)
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.