
প্রধান পর্যবেক্ষণ
- টেদার স্মার্টফোনে বড় ভাষা মডেল প্রশিক্ষণের জন্য একটি কাঠামো চালু করেছে।
- সিস্টেমটি বিটনেট আর্কিটেকচার এবং লোরা ফাইন-টিউনিং ব্যবহার করে গণনার প্রয়োজনীয়তা কমিয়েছে।
- ক্রিপ্টো কোম্পানিগুলি এআই অবকাঠামো এবং হাই-পারফরম্যান্স কম্পিউটিং-এ ব্যয় বাড়িয়েছে।
টেদার প্রকাশ করেছে একটি নতুন কৃত্রিম বুদ্ধিমত্তা প্রশিক্ষণ কাঠামো মঙ্গলবার, যা বড় ভাষা মডেলগুলিকে কনজুমার হার্ডওয়্যারে চালানো এবং ফাইন-টিউন করতে সক্ষম করে। এই সিস্টেমটি কোম্পানির QVAC প্ল্যাটফর্মের অংশ হিসেবে গঠিত হয়েছিল এবং কয়েকটি নন-নভিডিয়া প্রসেসরের সাথে স্মার্টফোনকেও সমর্থন করেছিল। ইঞ্জিনিয়ারদের এই কাঠামোটি মেমোরির প্রয়োজনীয়তা কমানোর জন্য ডিজাইন করা হয়েছিল, যার ফলে ভাষা মডেল তৈরি এবং পরীক্ষা করার খরচের বাধা কমেছে।
এই চালু হয় যখন ক্রিপ্টো ইনফ্রাস্ট্রাকচার কোম্পানিগুলি কৃত্রিম বুদ্ধিমত্তা উন্নয়ন এবং কম্পিউট বাজারের দিকে আরও গভীরে যায়। বাজারের সবচেয়ে বড় স্টেবলকয়েনের প্রকাশক টেটার, এই প্রকাশকে মেশিন-লার্নিং ক্ষমতা বিকেন্দ্রীকরণের চেষ্টা হিসেবে উপস্থাপন করে। কোম্পানিটি যুক্তি দেয় যে, প্রচুর পরিমাণে উপলব্ধ হার্ডওয়্যারে মডেল ট্রেনিং সক্ষম করলে কেন্দ্রীয়কৃত ক্লাউড প্রোভাইডারদের উপর নির্ভরশীলতা কমিয়ে আনা যাবে।
টেদার বিটনেট-ভিত্তিক প্রশিক্ষণ সিস্টেম চালু করেছে
টেথারের ঘোষণায় এই কাঠামোকে মাইক্রোসফটের বিটনেট আর্কিটেকচারের উপর ভিত্তি করে একটি প্রশিক্ষণ পরিবেশ হিসাবে বর্ণনা করা হয়েছে। ডিজাইনটি এক-বিট নিউরাল নেটওয়ার্ক কাঠামো এবং LoRA ফাইন-টিউনিং পদ্ধতির সংমিশ্রণ ব্যবহার করে, যা ডেভেলপারদের গণনার চাহিদা কম রেখে মডেলগুলি সামঞ্জস্য করতে সক্ষম করে।

কোম্পানির ইঞ্জিনিয়ারদের মতে, সিস্টেমটি স্মার্টফোনে এক বিলিয়ন প্যারামিটার পর্যন্ত ভাষা মডেল প্রশিক্ষণ দিয়েছে দুই ঘন্টারও কম সময়ে। একই পদ্ধতির মাধ্যমে অপ্টিমাইজ করলে ছোট মডেলগুলি কয়েক মিনিটেরও কম সময়ে প্রশিক্ষণ সম্পন্ন করেছে। কোম্পানিটি আরও বলেছে যে প্ল্যাটফর্মটি মোবাইল ডিভাইসে তেরো বিলিয়ন প্যারামিটার পর্যন্ত মডেলকে সমর্থন করে।
প্রকৌশলীরা এনভিডিয়া চিপের উপর নির্ভর করার পরিবর্তে বিভিন্ন হার্ডওয়্যার বাস্তুতন্ত্রে সিস্টেমটি চালানোর জন্য এটি তৈরি করেছেন। ফ্রেমওয়ার্কটি AMD প্রসেসর, ইন্টেল আর্কিটেকচার, অ্যাপল সিলিকন সিস্টেম এবং কোয়ালকম এবং অ্যাপলের মোবাইল গ্রাফিক্স প্রসেসরকে সমর্থন করে। এই সামঞ্জস্যতা পারম্পরিক হাই-পারফরম্যান্স কম্পিউটিং ক্লাস্টারগুলির বাইরে মেশিন-লার্নিং পরীক্ষা-নিরীক্ষার প্রবেশাধিকারকে বিস্তৃত করেছে।
প্রযুক্তিগত ডিজাইনটি মানক মডেলগুলির তুলনায় গ্রাফিক্স মেমোরির প্রয়োজনীয়তা কমিয়েছে। অভ্যন্তরীণ প্রকৌশল ফলাফলগুলি দেখিয়েছে যে বিটনেট আর্কিটেকচার 16-বিট সিস্টেমের তুলনায় ভিআরএম ব্যবহার 77.8% পর্যন্ত কমিয়েছে।
টেদার এআই কম্পিউটকে নভিডিয়া হার্ডওয়্যারের বাইরে নিয়ে যায়
টেথার বলেছে যে এই আর্কিটেকচারটি নভিডিয়া বাস্তুতন্ত্রের বাইরের হার্ডওয়্যারে LoRA ফাইন-টিউনিং সক্ষম করে। ঐতিহাসিকভাবে ডেভেলপাররা বড় টেনসর গণনা দক্ষতার কারণে নভিডিয়া গ্রাফিক্স প্রসেসরগুলির উপর নির্ভরশীল ছিল। টেথারের ইঞ্জিনিয়াররা বিকল্প প্রসেসরগুলিতে লো-বিট ট্রেনিং পদ্ধতি সক্ষম করে এই সীমাবদ্ধতা সরিয়ে ফেলার চেষ্টা করেছিল।
কোম্পানিটি যুক্তি দেয় যে আর্কিটেকচারটি মোবাইল ওয়ার্কলোডের জন্য উপসংহার গতি উন্নত করেছে। পরীক্ষাগুলি নির্দেশ করেছে যে মোবাইল গ্রাফিক্স প্রসেসরগুলি বিটনেট মডেলগুলিকে স্ট্যান্ডার্ড সেন্ট্রাল প্রসেসিং ইউনিটগুলির চেয়ে কয়েকগুণ দ্রুত প্রক্রিয়া করেছে। এই পার্থক্যটি মডেলগুলিকে হাতের ডিভাইসগুলিতে স্থানীয়ভাবে চালানোর অনুমতি দিয়েছে, যা দূরবর্তী ক্লাউড ইনফ্রাস্ট্রাকচারের প্রয়োজনীয়তা বাদ দিয়েছে।
ডেভেলপাররা সিস্টেমের ভিতরে বিতরণকৃত মেশিন-লার্নিং পদ্ধতিও অন্বেষণ করেছে। টেথার স্বাধীন ডিভাইসের নেটওয়ার্কের মধ্যে আপডেট হওয়া ফেডারেটেড লার্নিং মডেলের সম্ভাব্য ব্যবহারের কথা উল্লেখ করেছে। এই কাঠামোর অধীনে, মডেলগুলি স্থানীয় ডেটা থেকে শিখে, প্রতিটি ডিভাইসের তথ্য কেন্দ্রীয় সার্ভারগুলিতে আপলোড করার পরিবর্তে সেখানেই রাখে।
কোম্পানিটি এই পদ্ধতিটির মাধ্যমে গোপনীয়তা-কেন্দ্রিক ট্রেনিং পরিবেশ সমর্থন করা যেতে পারে বলে প্রস্তাব করে। ডেটা স্থানীয়ভাবে রাখা হয়েছিল, যখন শুধুমাত্র মডেল আপডেটগুলি নেটওয়ার্কের মধ্যে স্থানান্তরিত হয়েছিল। সেই আর্কিটেকচারটি ডিসেন্ট্রালাইজড কম্পিউটিং সিস্টেম এবং বিতরিত ক্রিপ্টোগ্রাফিক নেটওয়ার্কগুলির মধ্যে প্রচলিত প্রবণতাগুলির অনুকরণ করেছিল।
টেথার বিস্তার ক্রিপ্টো শিল্পের এআই প্রচেষ্টাকে প্রতিফলিত করে
ডিজিটাল সম্পদ খাতের বাজার ক্রিয়াকলাপে কৃত্রিম বুদ্ধিমত্তা অবকাঠামোতে বিনিয়োগ বৃদ্ধি পেয়েছে। ক্রিপ্টো কোম্পানিগুলি ব্লকচেইন অপারেশনের জন্য তৈরি কম্পিউটিং ক্ষমতাকে মেশিন-লার্নিং কাজের দিকে পুনর্নির্দেশিত করছে।
পাবলিক ফাইলিংগুলিতে প্রকাশ পেয়েছে যে প্রযুক্তি কোম্পানিগুলি কৃত্রিম বুদ্ধিমত্তার চাহিদার সাথে সংযুক্ত কম্পিউটিং পাওয়ার নিশ্চিত করতে অংশীদারিত্ব গঠন করেছে। সেপ্টেম্বরে ঘোষিত একটি চুক্তিতে $3 বিলিয়ন মূল্যের 10-বছরের চুক্তির অংশ হিসেবে গুগলকে সাইফার মাইনিং-এর একটি অল্প অংশীদারিত্ব দেওয়া হয়েছে। এই ব্যবস্থাটি ডেটা সেন্টারের ক্ষমতাকে কৃত্রিম বুদ্ধিমত্তা প্রসেসিংয়ের প্রয়োজনীয়তার সাথে সংযুক্ত করেছে।
কর্পোরেট ঘোষণাগুলি পরে বলেছিল যে বিটকয়েন মাইনিং কোম্পানিগুলিও মেশিন-লার্নিং সেবাগুলিতে মূলধন পুনঃনির্দেশ করেছে। ডিসেম্বরে, মাইনার IREN কৃত্রিম বুদ্ধিমত্তার অপারেশনের জন্য প্রায় 3.6 বিলিয়ন ডলার উঠানোর পরিকল্পনা প্রকাশ করেছিল।
বছরের শুরুতে কর্পোরেট আয় প্রতিবেদনগুলি একই প্রবণতাকে শক্তিশালী করেছে। হাইভ ডিজিটাল টেকনোলজিজ তার হাই-পারফরম্যান্স কম্পিউটিং সেবা বিস্তারের পরে $93.1 মিলিয়ন আয় ঘোষণা করেছে। প্রায় একই সময়ে, কোর সায়েন্টিফিক মরগান স্ট্যানলির কাছ থেকে তার কম্পিউটিং অবকাঠামোর বৃদ্ধির জন্য $500 মিলিয়নের ঋণ সুবিধা পেয়েছে।
ডেভেলপাররা ব্লকচেইন ইনফ্রাস্ট্রাকচারের সাথে একীভূত স্বয়ংসম্পূর্ণ কৃত্রিম বুদ্ধিমত্তা এজেন্টগুলির সাথে পরীক্ষা-নিরীক্ষা করেছে। Coinbase ওয়ালেট টুলস চালু করেছে যা সফটওয়্যার এজেন্টগুলিকে সরাসরি অন-চেইনে লেনদেন সম্পাদন করতে দেয়। Alchemy সেবা চালু করেছে যা এজেন্টগুলিকে ব্লকচেইন ডেটা অ্যাক্সেস করতে দেয় এবং স্টেবলকয়েন ইনফ্রাস্ট্রাকচারের মাধ্যমে পayment সেটেল করে।
পরিচয় নেটওয়ার্কগুলি কৃত্রিম বুদ্ধিমত্তা সিস্টেম এবং ডিজিটাল যাচাইয়ের মধ্যে সম্পর্কও অন্বেষণ করেছে। ওপেনএআই-এর প্রধান স্যাম আলটম্যান দ্বারা প্রতিষ্ঠিত ওয়ার্ল্ড পরিচয় নেটওয়ার্ক এই সপ্তাহের শুরুতে এজেন্টকিট প্রকাশ করে। এই টুলকিটটি সফটওয়্যার এজেন্টগুলিকে ওয়ার্ল্ড আইডি সিস্টেমের মাধ্যমে একটি অনন্য মানব পরিচয়ের সাথে তাদের সংযোগ যাচাই করতে সক্ষম করে।
টেদারের সর্বশেষ কাঠামোটি সেই একই বিস্তৃত ক্ষেত্রে প্রবেশ করেছে, যেখানে কম্পিউটিং সংস্থান, মেশিন লার্নিং এবং ব্লকচেইন সিস্টেম পরস্পরের সাথে মিলিত হয়েছে।
কোম্পানিটি বলেছে যে ডেভেলপাররা কেন্দ্রীয় সার্ভারের উপর নির্ভর করা ছাড়াই ট্রেনিং টুলগুলিকে বিতরিত অ্যাপ্লিকেশন এবং স্থানীয় ডিভাইসে একীভূত করতে পারবেন।
টেটারের কৃত্রিম বুদ্ধিমত্তা ফ্রেমওয়ার্কের পরবর্তী উন্নয়ন ডেভেলপার গ্রহণ এবং ডিভাইস-লেভেল পারফরম্যান্স টেস্টিং-এর উপর নির্ভর করবে। ইঞ্জিনিয়ারদের পরবর্তী রিলিজগুলিতে QVAC প্ল্যাটফর্মটি বিতরিত কনজুমার হার্ডওয়্যারে বড় মডেলগুলি কীভাবে পরিচালনা করে তা পর্যবেক্ষণ করা সম্ভব।
পোস্টটি Tether স্মার্টফোনে মডেল ট্রেনিং সক্ষম করে এমন এআই ফ্রেমওয়ার্ক প্রকাশ করেছে প্রথম প্রকাশিত হয় The Coin Republic-এ।
