স্যাপিয়েন্ট 1.9 দিনে $1,500 খরচে 1.15B-প্যারামিটার HRM-টেক্সট মডেল প্রশিক্ষণ দেয়

শুরু থেকে একটি বড় ভাষা মডেল প্রশিক্ষণ দেওয়া খরচবহুল হওয়া উচিত। স্যাপিয়েন্ট ইন্টেলিজেন্স শুধুমাত্র একটি ম্যাকবুক প্রো-এর চেয়েও কম খরচে এটি করেছে।

সিঙ্গাপুরভিত্তিক স্টার্টআপটি HRM-Text নামক একটি 1.15 বিলিয়ন প্যারামিটারযুক্ত ভাষা মডেল প্রকাশ করেছে, যা 1.9 দিনে 16 GPU ব্যবহার করে প্রশিক্ষিত হয়েছে এবং মোট খরচ হয়েছে $1,000 থেকে $1,500-এর মধ্যে। মডেলটি GitHub এবং Hugging Face-এ সম্পূর্ণরূপে ওপেন-সোর্সড, যার অর্থ যেকোনো ব্যক্তি এটি পরীক্ষা, পরিবর্তন এবং ডিপ্লয় করতে পারেন।

HRM-Text কিভাবে কাজ করে এবং এটি কেন গুরুত্বপূর্ণ

GPT এবং এর সহযোগীদের পিছনের আর্কিটেকচার হিসেবে পরিচিত প্রাচীন ট্রান্সফরমার-ভিত্তিক মডেলগুলি সাধারণত ট্রিলিয়ন টোকেনে প্রশিক্ষণ প্রয়োজন। HRM-Text প্রায় 40 বিলিয়ন স্ট্রাকচারড টোকেনে প্রশিক্ষিত হয়েছে। এটি অর্ডার অফ ম্যাগনিটিউড কম ডেটা, তবুও মডেলটি এখনও প্রতিযোগিতামূলক বেঞ্চমার্ক স্কোর অর্জন করে।

বিজ্ঞাপন

MATH বেঞ্চমার্কে, HRM-Text স্কোর করেছে 56.2। DROP-এ, যা বিচ্ছিন্ন যুক্তি প্রয়োজন করে এমন একটি পাঠ্য বুঝার পরীক্ষা, এটি পেয়েছে 82.2। স্যাপিয়েন্ট এই ফলাফলগুলিকে Meta-এর Llama 3.2 3B এবং Alibaba-এর Qwen 3.5 2B মডেলগুলির সাথে তুলনা করে, যাদের প্রশিক্ষণের জন্য অনেক বেশি সম্পদ প্রয়োজন হয়েছিল।

মডেলের পিছনের কোম্পানি

স্যাপিয়েন্ট ইন্টেলিজেন্স ২০২৪ সালে গুয়ান ওয়াং এবং উইলিয়াম চেন দ্বারা প্রতিষ্ঠিত হয়। জানুয়ারি ২০২৫-এ কোম্পানিটি $২২ মিলিয়নের সিড রাউন্ড আকর্ষণ করে, যা এর মূল্যায়নকে $২০০ মিলিয়নের ঊর্ধ্বে নিয়ে যায়।

HRM আর্কিটেকচারটি প্রথম দেখা যায় জুন 2025-এর একটি পেপারে, যেখানে স্যাপিয়েন্ট 27 মিলিয়ন প্যারামিটার বিশিষ্ট একটি মডেল ব্যবহার করে প্রতিযোগিতামূলক পারফরম্যান্স দেখিয়েছিল। HRM-Text এই পদ্ধতিটিকে প্যারামিটার সংখ্যায় প্রায় 40x বৃদ্ধি করে, যখন শিল্পের মানদণ্ড অনুযায়ী কম্পিউট খরচকে উপেক্ষণীয় রাখে।

ক্রিপ্টো এবং ডিসেন্ট্রালাইজড এআই-এর জন্য এটির অর্থ কী

অন-চেইন এআই ইনফারেন্সের জন্য সবচেয়ে বড় বাধা হল কম্পিউট খরচ। অ্যাকাশ, রেন্ডার বা io.net এর মতো ডিসেন্ট্রালাইজড GPU নেটওয়ার্কে একটি বিলিয়ন প্যারামিটারের মডেল চালানো খরচি এবং ধীর। ১.১৫ বিলিয়ন প্যারামিটারে অর্থপূর্ণ যুক্তি দেখানোর ক্ষমতা রাখে এমন একটি মডেল, যা সাধারণ ডেটার একটি অংশে প্রশিক্ষিত, হঠাৎ করেই ডিসেন্ট্রালাইজড ডিপ্লয়মেন্টের জন্য অনেক বেশি বাস্তবসম্মত প্রার্থী হয়ে ওঠে।

যে সম্পূর্ণ ওপেন-সোর্স মডেল আর্কিটেকচার যে কেউ $1,500 খরচে ট্রেন করতে পারে, তা ডিসেন্ট্রালাইজড নেটওয়ার্কের মনোভাবের সাথে স্বাভাবিকভাবেই মিলে যায়, যারা OpenAI বা Anthropic API-এর উপর নির্ভর না করে AI সার্ভিস প্রদান করতে চায়।