LlamaIndex lanza LiteParse v2.0 reescrito en Rust, con aumentos de velocidad de hasta 100x
KuCoinFlash
Compartir
Resumen
LlamaIndex ha lanzado LiteParse v2.0, una reescritura en Rust de su biblioteca de análisis de documentos. La actualización aumenta la velocidad hasta 100 veces para archivos pequeños y 3 veces para los grandes. Admite PDF, DOCX, XLSX y PPTX, con OCR mediante PDFium y tesseract-rs. Están disponibles paquetes nativos para Python, JavaScript y Rust, junto con soporte para WebAssembly. Las altcoins a vigilar podrían beneficiarse de tales mejoras de eficiencia. El índice de miedo y codicia podría reaccionar si la adopción aumenta.
ME AI Noticia, según el monitoreo de Beating, LlamaIndex anunció que reescribió por completo la biblioteca de análisis de documentos LiteParse en Rust, lanzando la versión 2.0. El analizador central重构ado mejora hasta 100 veces la velocidad en el procesamiento de documentos pequeños y logra un aumento de casi 3 veces en el análisis de documentos grandes. La reestructuración tiene como objetivo proporcionar una base de análisis espacial local, de alta velocidad y sin necesidad de llamar a modelos grandes, para agentes de IA y pipelines de generación mejorada por recuperación (RAG). LiteParse 2.0 mantiene su diseño de ejecución local sin dependencia de modelos grandes, integra una rama profundamente personalizada de PDFium para análisis espacial de layout y combina la biblioteca tesseract-rs para implementar funcionalidades de reconocimiento óptico de caracteres (OCR) localmente. La herramienta actualmente admite PDF y documentos de Office como DOCX, XLSX y PPTX. El analizador proyecta el texto en una representación bidimensional según el layout del documento, generando texto estructurado que conserva las relaciones espaciales y de layout, proporcionando a los modelos grandes una ubicación y contexto de referencia de alta fidelidad con un consumo energético extremadamente bajo. En cuanto a la integración y distribución en el ecosistema, LlamaIndex ofrece soporte nativo para los principales entornos de ejecución. Los desarrolladores pueden integrar rápidamente LiteParse en sus flujos de trabajo mediante pip install liteparse en Python, npm i @llamaindex/liteparse en JavaScript o mediante el repositorio Cargo en Rust. Gracias a su construcción subyacente en Rust, la nueva versión permite la ejecución local en navegadores y nodos de cómputo periférico al compilarse en formato WebAssembly. Cabe destacar que, debido a las limitaciones del entorno, la funcionalidad OCR en WebAssembly no está integrada; los desarrolladores deben implementar el escaneo de archivos mediante llamadas externas (por ejemplo, invocando tesseract.js). (Fuente: BlockBeats)
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.