কোহের তার প্রথম ওপেন-সোর্স এজেন্টিক কোডিং মডেল প্রকাশ করেছে, এবং এই আর্কিটেকচারটি বলে দেয় যে এন্টারপ্রাইজ এআই প্রতিযোগিতা কোথায় যাচ্ছে। নর্থ মিনি কোড 1.0, একটি 30 বিলিয়ন প্যারামিটার মিক্সচার-অফ-এক্সপার্টস মডেল, 9 জুনে অ্যাপাচি 2.0 লাইসেন্সের অধীনে চালু হয়েছে, যা Hugging Face-এ যেকোনো ব্যক্তির জন্য ফ্রি হিসেবে উপলব্ধ, যারা অন্যের ক্লাউডের দিকে ফোন করা ছাড়াই একটি ক্ষমতাশালী কোডিং সহায়ক চালাতে চান।
মডেলটি কৃত্রিম বিশ্লেষণ বুদ্ধিমত্তা সূচকে 27.6 পেয়েছে, যা আমরা বিভিন্ন ক্ষমতার উপর ভিত্তি করে এআই মডেলগুলির তুলনা করার জন্য একটি মানকীকরণ প্রচেষ্টা।
এটি কাজ করার জন্য MoE ট্রিক
নর্থ মিনি কোড প্রতিটি কোয়েরি বড় মডেলের মধ্যে বিশেষজ্ঞ নেটওয়ার্কের একটি ছোট সাবসেটে রাউট করে, যার মোট 30 বিলিয়ন প্যারামিটার রয়েছে কিন্তু যেকোনো সময় শুধুমাত্র 3 বিলিয়ন সক্রিয় থাকে, যার ফলে একটি ঘন 30B মডেলের প্রয়োজনীয়তার তুলনায় ইনফারেন্স খরচ অনেক কম।
মডেলটি 256K টোকেনের কনটেক্সট দৈর্ঘ্য সমর্থন করে এবং 64K টোকেন পর্যন্ত আউটপুট জেনারেট করতে পারে। এই সংখ্যাগুলিকে বুঝতে, 256K টোকেন প্রায় একটি মধ্যম আকারের কোডবেসের সম্পূর্ণ সংগ্রহ মডেলকে দিয়ে ফাইল, ফাংশন এবং ডিপেনডেন্সির মধ্যে সম্পর্কগুলি বুঝতে বলার সমান। 64K আউটপুট সীমা মানে এটি ডেভেলপারদের একাধিক ছোট আউটপুটকে চেইন করার প্রয়োজনীয়তা ছাড়াই একক পাসে বড় বড় কোড ব্লক জেনারেট করতে পারে।
কোহেরের সহ-প্রতিষ্ঠাতা নিক ফ্রস্ট লঞ্চের কয়েক দিন আগে সোশ্যাল মিডিয়ায় মডেলটির প্রস্তাবনা দেন, যা প্রায় 6-7 জুনের মধ্যে প্রাথমিক সম্প্রদায়ের জন্য উপলব্ধ হয় এবং 9 জুনে সম্পূর্ণ সাধারণ প্রকাশ হয়।
কেন ওপেন-সোর্স, এবং কেন এখন
Apache 2.0 লাইসেন্স হল ওপেন-সোর্সের সবচেয়ে অনুমতিমূলক লাইসেন্স, যার অর্থ কোম্পানিগুলি মডেলটি পরিবর্তন, বাস্তবায়ন এবং এমনকি বাণিজ্যিকভাবে ব্যবহার করতে পারে লাইসেন্সিংয়ের কোনও সমস্যা ছাড়াই। একটি আর্থিক প্রতিষ্ঠানের এন্টারপ্রাইজ CTO-এর জন্য, যিনি কমপ্লায়েন্স থেকে শুনেছেন যে কোনও প্রপ্রাইটারি ডেটা ভবন থেকে বাইরে যাবে না, এটিই সেই ধরনের মডেল যা আইনগত পর্যালোচনা পার করতে পারে।
এই প্রকাশ ঘটেছে মে ২০-এ কোহের তার আগের মডেল কমান্ড A+ চালু করার তিন সপ্তাহের মধ্যে। কমান্ড A+ কে আর্টিফিশিয়াল অ্যানালিসিস ইন্টেলিজেন্স সূচকে ৩৭ পয়েন্ট পাওয়া গেছে। এই ক্রমটি বোঝায় যে কোম্পানিটি তার প্রকাশের সময়সূচীকে ত্বরান্বিত করছে।
এটি বিনিয়োগকারী এবং ব্যাপক বাজারের জন্য কী অর্থ বহন করে
মোট 30B, যার মধ্যে 3B সক্রিয় প্যারামিটার বিভাজনের মানে হলো সংগঠনগুলি এটি একটি তুলনামূলক ঘন মডেলের চেয়ে অনেক কম হার্ডওয়্যারে চালাতে পারবে, যা এন্টারপ্রাইজ AI গ্রহণকে মহঁগা এবং লজিস্টিক্সের দিক থেকে কষ্টকর করে তোলা GPU প্রয়োজনীয়তা কমিয়ে দিতে পারে।
AI সেক্টর পর্যবেক্ষণ করছেন এমন যারা কোনো বিশেষায়িত কোডিং মডেল কয়েকটি বিজয়ীর চারপাশে একীভূত হবে কিনা তা নিয়ে প্রশ্ন করছেন, নাকি এটি বিভক্ত হয়েই থাকবে। নর্থ মিনি কোডের 256K কনটেক্সট উইন্ডো এবং 64K আউটপুট দৈর্ঘ্য ইঙ্গিত করে যে Cohere এজেন্টিক ওয়ার্কফ্লোর দিকে লক্ষ্য রাখছে, যেখানে AI মডেলগুলি শুধুমাত্র কোডের একটি লাইন সম্পূর্ণ করবে না, বরং সম্পূর্ণ সফটওয়্যার ইঞ্জিনিয়ারিং টাস্কগুলির পরিকল্পনা, বাস্তবায়ন এবং পুনরাবৃত্তি করবে।
