LlamaIndex запускає LiteParse v2.0, переписаний на Rust, прискорення до 100 разів
KuCoinFlash
Поділитися
Короткий зміст
LlamaIndex запустив LiteParse v2.0 — переписаний на Rust варіант своєї бібліотеки для розбору документів. Оновлення збільшує швидкість до 100 разів для малих файлів і в 3 рази — для великих. Підтримує PDF, DOCX, XLSX та PPTX з OCR за допомогою PDFium і tesseract-rs. Доступні нативні пакети для Python, JavaScript і Rust, а також підтримка WebAssembly. Альткоїни, за якими варто стежити, можуть вигодувати від таких збільшень ефективності. Індекс страху та жадібності може відреагувати, якщо адаптація зросте.
ME AI Новина: за даними моніторингу Beating, LlamaIndex оголосила про повну переробку бібліотеки для розбору документів LiteParse на Rust і випуск версії 2.0. Після реконструкції основний розбірник прискорив обробку малих документів до 100 разів, а великих — майже в 3 рази. Ця реконструкція створена для забезпечення локальної, швидкої та не залежної від великих моделей основи для розбору макетів у AI-агентів та RAG-каналах. LiteParse 2.0 зберігає дизайн локальної роботи без залежності від великих моделей, інтегрує глибоко налаштовану гілку PDFium для аналізу просторової компоновки та поєднує бібліотеку tesseract-rs для локального виконання OCR. Інструмент підтримує PDF та офісні документи, такі як DOCX, XLSX і PPTX. Розбірник проєктує текст у двовимірний простір згідно з макетом документа, виводячи структурований текст із збереженням просторових та макетних відносин, щоб надавати великої моделі високоточну локалізацію та контекст з мінімальним споживанням енергії. У сфері інтеграції та розповсюдження LlamaIndex надає нативні пакети для основних середовищ виконання. Розробники можуть швидко підключитися через pip install liteparse для Python, npm i @llamaindex/liteparse для JavaScript або Cargo для Rust. Завдяки використанню Rust у нижньому рівні, нова версія підтримує компіляцію у формат WebAssembly, що дозволяє запускати її у браузері та на краєвих обчислювальних вузлах. Варто зазначити, що через обмеження середовища функція OCR у WebAssembly не вбудована — розробники повинні реалізувати сканування файлів через зовнішні зворотні виклики (наприклад, виклик tesseract.js). (Джерело: BlockBeats)
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації.
Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.