LlamaIndex লঞ্চ করেছে LiteParse v2.0, যা Rust-এ পুনর্লিখিত হয়েছে এবং গতি বৃদ্ধি পেয়েছে প্রায় 100x
KuCoinFlash
শেয়ার
সারাংশ
LlamaIndex এখন LiteParse v2.0 চালু করেছে, যা এর ডকুমেন্ট পার্সিং লাইব্রেরির একটি Rust-ভিত্তিক পুনর্লিখন। এই আপডেটটি ছোট ফাইলের জন্য প্রায় 100x এবং বড় ফাইলের জন্য 3x গতি বৃদ্ধি করে। এটি PDF, DOCX, XLSX এবং PPTX সমর্থন করে, যার মধ্যে PDFium এবং tesseract-rs এর মাধ্যমে OCR অন্তর্ভুক্ত। Python, JavaScript এবং Rust-এর জন্য নেটিভ প্যাকেজ এবং WebAssembly সমর্থন উপলব্ধ। এই দক্ষতা বৃদ্ধির কারণে অল্টকয়েনগুলির উপর প্রভাব পড়তে পারে। যদি গ্রহণযোগ্যতা বাড়ে, তবে ভয় এবং লালসা সূচকেরও প্রতিক্রিয়া হতে পারে।
ME AI বার্তা অনুযায়ী, 动察 Beating-এর মনিটরিং থেকে জানা গেছে, LlamaIndex ঘোষণা করেছে যে তারা ওপেন সোর্স ডকুমেন্ট পার্সিং লাইব্রেরি LiteParse-কে সম্পূর্ণভাবে Rust দিয়ে পুনর্লিখন করে 2.0 সংস্করণ প্রকাশ করেছে। পুনর্গঠিত কোর পার্সার ছোট ডকুমেন্ট প্রক্রিয়াকরণের ক্ষেত্রে গতি সর্বোচ্চ 100 গুণ পর্যন্ত বাড়িয়েছে, আর বড় ডকুমেন্ট পার্স করার ক্ষেত্রেও প্রায় 3 গুণ গতি বৃদ্ধি পেয়েছে। এই পুনর্গঠনটির উদ্দেশ্য হলো AI এজেন্ট এবং Retrieval-Augmented Generation (RAG) পাইপলাইনের জন্য এমন একটি স্পেসিয়াল লেআউট পার্সিং ভিত্তি সরবরাহ করা, যা লোকালভাবে চলতে পারে, অত্যন্ত দ্রুত, এবং যেখানে বড় মডেল কল করার প্রয়োজন নেই। LiteParse 2.0 বড় মডেলের ওপর নির্ভরতা ছাড়াই লোকাল রান করার ডিজাইন বজায় রেখেছে, স্পেসিয়াল লেআউট বিশ্লেষণের জন্য PDFium-এর ডীপ কাস্টমাইজড ব্রাঞ্চ ইন্টিগ্রেট করেছে, এবং tesseract-rs লাইব্রেরি মিলিয়ে লোকালভাবে Optical Character Recognition (OCR) ফাংশনালিটি বাস্তবায়ন করেছে। এই টুল বর্তমানে PDF এবং DOCX, XLSX ও PPTX সহ Office ডকুমেন্ট সাপোর্ট করে। পার্সার ডকুমেন্টের লেআউট অনুযায়ী টেক্সটের দ্বিমাত্রিক স্পেসিয়াল প্রজেকশন তৈরি করে, অবস্থান এবং লেআউটের আপেক্ষিক সম্পর্ক সংরক্ষণ করে এমন স্ট্রাকচার্ড টেক্সট আউটপুট দেয়, যা অত্যন্ত কম পাওয়ার কনজাম্পশনেই বড় মডেলকে উচ্চ-নিষ্ঠা (high-fidelity) লোকেশনিং এবং কনটেক্সট রেফারেন্স প্রদান করে। ইকোসিস্টেম ইন্টিগ্রেশন ও ডিস্ট্রিবিউশনের ক্ষেত্রে, LlamaIndex মূলধারার বিভিন্ন রানটাইম জুড়ে নেটিভ প্যাকেজ সাপোর্ট প্রদান করেছে। ডেভেলপাররা Python-এ pip install liteparse, JavaScript-এ npm i @llamaindex/liteparse, Rust-এ Cargo রেপোজিটরি ব্যবহার করে দ্রুততার সাথে ডেভেলপমেন্ট ওয়ার্কফ্লোতে এই টুল যুক্ত করতে পারেন। নিচের স্তরে Rust ব্যবহারের সুফল হিসেবে, নতুন সংস্করণটি WebAssembly ফরম্যাটে কম্পাইল করা যায়, ফলে ব্রাউজার সাইড এবং এজ কম্পিউটিং নোড উভয় জায়গাতেই লোকাল রান করার সক্ষমতা উন্মুক্ত হয়েছে। উল্লেখ করা প্রয়োজন, রানটাইম এনভায়রনমেন্ট সীমাবদ্ধ থাকার কারণে WebAssembly পরিবেশে OCR ফিচারটি বিল্ট-ইন নয়; ডেভেলপারদের বহিরাগত কলব্যাক ইনজেকশন (যেমন tesseract.js কল করা) এর মাধ্যমে ফাইল স্ক্যানিং বাস্তবায়ন করতে হবে। (উৎস: BlockBeats)
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।