স্যাপিয়েন্ট 1.9 দিনে $1,500 খরচে 1.15B-প্যারামিটার HRM-টেক্সট মডেল প্রশিক্ষণ দেয়

iconCryptoBriefing
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
সিঙ্গাপুরভিত্তিক একটি স্টার্টআপ স্যাপিয়েন্ট ইন্টেলিজেন্স 16টি GPU ব্যবহার করে 1.9 দিনে শুধুমাত্র $1,000–$1,500 খরচে 1.15B প্যারামিটারের একটি মডেল হ্রম-টেক্সট প্রশিক্ষণ দিয়েছে। এই মডেলটি গিটহাব এবং হাগিং ফেসে ওপেন-সোর্স করা হয়েছে, যা 40B টোকেনে প্রশিক্ষণ দেওয়ার পর MATH-এ 56.2 এবং DROP-এ 82.2 স্কোর করেছে। জানুয়ারি 2025-এ $22 মিলিয়নের সীড রাউন্ডের পর কোম্পানিটির মূল্য $200 মিলিয়নের বেশি। কোম্পানিটি বলছে যে এই মডেলের দক্ষতা ডিসেন্ট্রালাইজড AI-কে সমর্থন করে। অন-চেইন ডেটা দেখায় খরচ-কার্যকরী AI সমাধানগুলির প্রতি আগ্রহ বৃদ্ধি পাচ্ছে, যেখানে ভয় এবং লালসা সূচকটি সস্তা মডেলগুলির প্রতি বাজারের আত্মবিশ্বাসের বৃদ্ধির প্রতিফলন ঘটিয়েছে।

শুরু থেকে একটি বড় ভাষা মডেল প্রশিক্ষণ দেওয়া খরচবহুল হওয়া উচিত। স্যাপিয়েন্ট ইন্টেলিজেন্স শুধুমাত্র একটি ম্যাকবুক প্রো-এর চেয়েও কম খরচে এটি করেছে।

সিঙ্গাপুরভিত্তিক স্টার্টআপটি HRM-Text নামক একটি 1.15 বিলিয়ন প্যারামিটারযুক্ত ভাষা মডেল প্রকাশ করেছে, যা 1.9 দিনে 16 GPU ব্যবহার করে প্রশিক্ষিত হয়েছে এবং মোট খরচ হয়েছে $1,000 থেকে $1,500-এর মধ্যে। মডেলটি GitHub এবং Hugging Face-এ সম্পূর্ণরূপে ওপেন-সোর্সড, যার অর্থ যেকোনো ব্যক্তি এটি পরীক্ষা, পরিবর্তন এবং ডিপ্লয় করতে পারেন।

HRM-Text কিভাবে কাজ করে এবং এটি কেন গুরুত্বপূর্ণ

GPT এবং এর সহযোগীদের পিছনের আর্কিটেকচার হিসেবে পরিচিত প্রাচীন ট্রান্সফরমার-ভিত্তিক মডেলগুলি সাধারণত ট্রিলিয়ন টোকেনে প্রশিক্ষণ প্রয়োজন। HRM-Text প্রায় 40 বিলিয়ন স্ট্রাকচারড টোকেনে প্রশিক্ষিত হয়েছে। এটি অর্ডার অফ ম্যাগনিটিউড কম ডেটা, তবুও মডেলটি এখনও প্রতিযোগিতামূলক বেঞ্চমার্ক স্কোর অর্জন করে।

বিজ্ঞাপন

MATH বেঞ্চমার্কে, HRM-Text স্কোর করেছে 56.2। DROP-এ, যা বিচ্ছিন্ন যুক্তি প্রয়োজন করে এমন একটি পাঠ্য বুঝার পরীক্ষা, এটি পেয়েছে 82.2। স্যাপিয়েন্ট এই ফলাফলগুলিকে Meta-এর Llama 3.2 3B এবং Alibaba-এর Qwen 3.5 2B মডেলগুলির সাথে তুলনা করে, যাদের প্রশিক্ষণের জন্য অনেক বেশি সম্পদ প্রয়োজন হয়েছিল।

মডেলের পিছনের কোম্পানি

স্যাপিয়েন্ট ইন্টেলিজেন্স ২০২৪ সালে গুয়ান ওয়াং এবং উইলিয়াম চেন দ্বারা প্রতিষ্ঠিত হয়। জানুয়ারি ২০২৫-এ কোম্পানিটি $২২ মিলিয়নের সিড রাউন্ড আকর্ষণ করে, যা এর মূল্যায়নকে $২০০ মিলিয়নের ঊর্ধ্বে নিয়ে যায়।

HRM আর্কিটেকচারটি প্রথম দেখা যায় জুন 2025-এর একটি পেপারে, যেখানে স্যাপিয়েন্ট 27 মিলিয়ন প্যারামিটার বিশিষ্ট একটি মডেল ব্যবহার করে প্রতিযোগিতামূলক পারফরম্যান্স দেখিয়েছিল। HRM-Text এই পদ্ধতিটিকে প্যারামিটার সংখ্যায় প্রায় 40x বৃদ্ধি করে, যখন শিল্পের মানদণ্ড অনুযায়ী কম্পিউট খরচকে উপেক্ষণীয় রাখে।

ক্রিপ্টো এবং ডিসেন্ট্রালাইজড এআই-এর জন্য এটির অর্থ কী

অন-চেইন এআই ইনফারেন্সের জন্য সবচেয়ে বড় বাধা হল কম্পিউট খরচ। অ্যাকাশ, রেন্ডার বা io.net এর মতো ডিসেন্ট্রালাইজড GPU নেটওয়ার্কে একটি বিলিয়ন প্যারামিটারের মডেল চালানো খরচি এবং ধীর। ১.১৫ বিলিয়ন প্যারামিটারে অর্থপূর্ণ যুক্তি দেখানোর ক্ষমতা রাখে এমন একটি মডেল, যা সাধারণ ডেটার একটি অংশে প্রশিক্ষিত, হঠাৎ করেই ডিসেন্ট্রালাইজড ডিপ্লয়মেন্টের জন্য অনেক বেশি বাস্তবসম্মত প্রার্থী হয়ে ওঠে।

যে সম্পূর্ণ ওপেন-সোর্স মডেল আর্কিটেকচার যে কেউ $1,500 খরচে ট্রেন করতে পারে, তা ডিসেন্ট্রালাইজড নেটওয়ার্কের মনোভাবের সাথে স্বাভাবিকভাবেই মিলে যায়, যারা OpenAI বা Anthropic API-এর উপর নির্ভর না করে AI সার্ভিস প্রদান করতে চায়।

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।