LlamaIndex lance LiteParse v2.0 réécrit en Rust, avec une augmentation de vitesse jusqu'à 100 fois

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
LlamaIndex a lancé LiteParse v2.0, une réécriture en Rust de sa bibliothèque d’analyse de documents. Cette mise à jour augmente la vitesse jusqu’à 100 fois pour les petits fichiers et 3 fois pour les grands. Elle prend en charge PDF, DOCX, XLSX et PPTX, avec OCR via PDFium et tesseract-rs. Des paquets natifs pour Python, JavaScript et Rust sont disponibles, ainsi qu’un support WebAssembly. Les altcoins à surveiller pourraient bénéficier de tels gains d’efficacité. L’indice de peur et de cupidité pourrait réagir si l’adoption augmente.
ME AI消息,根据动察Beating监测,LlamaIndex宣布将开源文档解析库LiteParse彻底用Rust重写,并发布2.0版本。重构后的核心解析器在处理小文档时速度提升高达100倍,解析大文档也有近3倍的提速。此次重构旨在为AI智能体与检索增强生成RAG管道提供本地运行、极速且无需调用大模型的空间版面解析底座。LiteParse 2.0保持了无大模型依赖的本地化运行设计,集成经过深度定制的PDFium分支进行空间版面分析,并结合tesseract-rs库在本地实现光学字符识别OCR功能。该工具目前支持PDF以及包括DOCX、XLSX和PPTX在内的Office文档。解析器将文本按文档布局进行二维空间投影,输出保留位置与版面相对关系的结构化文本,以极低功耗为大模型提供高保真定位与引用前情。在生态接入与分发方面,LlamaIndex提供了跨主流运行时的原生包支持。开发者可通过Python的pip install liteparse、JavaScript的npm i @llamaindex/liteparse以及Rust的Cargo仓库快速接入开发流程。得益于底层采用Rust构建,新版本通过编译为WebAssembly格式,打通了浏览器端与边缘计算节点的本地运行能力。需要指出的是,由于运行环境受限,WebAssembly环境下的OCR功能并非内置,开发者需通过外部回调注入(如调用tesseract.js)实现文件扫描。(来源:BlockBeats)
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.