LlamaIndex ra mắt LiteParse v2.0 được viết lại bằng Rust, tăng tốc độ lên đến 100x
KuCoinFlash
Chia sẻ
Tóm tắt
LlamaIndex đã ra mắt LiteParse v2.0, bản viết lại bằng Rust của thư viện phân tích tài liệu của họ. Bản cập nhật tăng tốc độ lên tới 100 lần đối với các tệp nhỏ và 3 lần đối với các tệp lớn. Nó hỗ trợ PDF, DOCX, XLSX và PPTX, với OCR thông qua PDFium và tesseract-rs. Các gói bản địa cho Python, JavaScript và Rust đã có sẵn, cùng với hỗ trợ WebAssembly. Các altcoin cần theo dõi có thể hưởng lợi từ những cải tiến về hiệu suất này. Chỉ số nỗi sợ và tham lam có thể phản ứng nếu mức độ áp dụng tăng lên.
ME AI tin tức, theo giám sát của Beating, LlamaIndex thông báo sẽ tái viết hoàn toàn thư viện phân tích tài liệu mở nguồn LiteParse bằng Rust và ra mắt phiên bản 2.0. Bộ phân tích lõi sau khi tái cấu trúc tăng tốc lên tới 100 lần khi xử lý tài liệu nhỏ và gần 3 lần khi xử lý tài liệu lớn. Việc tái cấu trúc nhằm cung cấp nền tảng phân tích bố cục tại chỗ, cực nhanh và không cần gọi đến mô hình lớn cho các tác nhân AI và đường ống RAG tăng cường truy vấn. LiteParse 2.0 vẫn giữ thiết kế chạy tại chỗ không phụ thuộc mô hình lớn, tích hợp nhánh PDFium được tùy chỉnh sâu để phân tích bố cục không gian, đồng thời kết hợp thư viện tesseract-rs để thực hiện chức năng nhận dạng ký tự quang học (OCR) tại chỗ. Công cụ hiện hỗ trợ PDF và các tài liệu Office bao gồm DOCX, XLSX và PPTX. Bộ phân tích chiếu văn bản theo bố cục tài liệu thành hình chiếu không gian hai chiều, đầu ra là văn bản có cấu trúc giữ nguyên vị trí và mối quan hệ bố cục, cung cấp thông tin định vị và bối cảnh tham chiếu độ chính xác cao với mức tiêu thụ năng lượng cực thấp cho mô hình lớn. Về tích hợp và phân phối sinh thái, LlamaIndex cung cấp hỗ trợ gói gốc cho các runtime chính. Nhà phát triển có thể nhanh chóng tích hợp vào quy trình phát triển thông qua pip install liteparse trong Python, npm i @llamaindex/liteparse trong JavaScript và kho Cargo trong Rust. Nhờ được xây dựng dưới nền tảng Rust, phiên bản mới có khả năng chạy tại chỗ trên trình duyệt và nút tính toán biên thông qua biên dịch sang định dạng WebAssembly. Cần lưu ý rằng do giới hạn môi trường chạy, chức năng OCR trong môi trường WebAssembly không được tích hợp sẵn; nhà phát triển cần thực hiện quét tệp bằng cách chèn hàm gọi lại bên ngoài (ví dụ: gọi tesseract.js). (Nguồn: BlockBeats)
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.