মিনিম্যাক্স M3 ওপেন-সোর্স মডেলগুলির মধ্যে শীর্ষে রয়েছে, চীনা সম্প্রদায়ে বিতর্ক সৃষ্টি করেছে

iconMetaEra
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
এই সপ্তাহের শীর্ষ অল্টকয়েন সংবাদের কেন্দ্রে রয়েছে MiniMax-এর M3 মডেল, যা বিশ্বব্যাপী শীর্ষ ওপেন-সোর্স মডেলগুলির মধ্যে একটি। মেটাEra-এর উপর ভিত্তি করে তৈরি এবং MiniMax Sparse Attention ব্যবহার করে, এই মডেলটি কোড জেনারেশনে Claude Opus 4.8-এর সমান পারফরম্যান্স দেখায় এবং প্রধান বেঞ্চমার্কগুলিতে শীর্ষ দশের মধ্যে রয়েছে। Vercel-এর CEO Guillermo Rauch পাবলিকলি মডেলটিকে সমর্থন করেছেন, তবে সাম্প্রতিক মূল্যনির্ধারণের পরিবর্তনগুলি চীনা সম্প্রদায়ের মধ্যে বিতর্কের সৃষ্টি করেছে। MiniMax বিদ্যমান ব্যবহারকারীদের জন্য ক্ষতিপূরণ প্রদান করছে এবং দশদিনের মধ্যে মডেলটিরওয়েটস্‌ এবং টেকনিক্যাল রিপোর্টটি ওপেন-সোর্স করবে, যাতে বাস্তব-বিশ্বের পরীক্ষা করা যায়। মডেলটির জনপ্রিয়তা বৃদ্ধির সাথে বিশ্বব্যাপী ক্রিপ্টোকারেন্সি নীতির আলোচনা তীব্রতর হতে পারে।
MiniMax এর M3 মডেল প্রকাশের মাধ্যমে বিশ্বব্যাপী মনোযোগ আকর্ষণ করেছে, যেখানে Vercel-এর CEO প্রকাশ্যে সমর্থন জানিয়েছেন, কিন্তু দেশীয় সম্প্রদায়ে মূল্য সমন্বয় নিয়ে বিতর্ক রয়েছে। ডেভেলপাররা ব্লাইন্ড টেস্ট এবং রিয়েল-ওয়ার্ল্ড টেস্টের মাধ্যমে M3-এর ক্ষমতা যাচাই করেছেন, যার ফলাফল দেখায় যে এটি Claude Opus 4.8-এর সাথে সমতুল্য কোড জেনারেশন করতে পারে এবং বিভিন্ন বেঞ্চমার্ক পরীক্ষায় বিশ্বের শীর্ষ ১০-এর মধ্যে প্রবেশ করেছে, যা এটিকে ওপেন-সোর্স মডেলগুলির মধ্যে সবচেয়ে শক্তিশালী করে তুলেছে। মডেলটি MiniMax Sparse Attention-এর একটি নতুন আর্কিটেকচার ব্যবহার করে, 100 লক্ষ কনটেক্সটের ক্ষেত্রে গণনা পরিমাণ আগের 1/20-এ হ্রাস পেয়েছে। MiniMax একইসাথে Agent Team ফিচারটি চালু করেছে, যা Leader, Worker, Verifier—এই তিনটি Agent-এর সহযোগিতায় কাজ করে। M3-এরওয়েটস্‌সহ সম্পূর্ণ প্রযুক্তিগত রিপোর্ট ১০দিনের মধ্যে ওপেন-সোর্স হবে, এবং বিশ্বব্যাপী ডেভেলপাররা বাস্তব-জীবনের প্রকল্পগুলিতে এটির পরীক্ষা করবেন।

লেখক এবং উৎস: নিউজিয়েন

নিউ জিয়ায়ুয়ান রিপোর্ট

【নিউ জ্ঞানের পরিচয়】 সিলিকন ভ্যালির বড় বড় ব্যক্তিত্ব সমর্থন করছেন, কিন্তু সম্প্রদায় এখন ঝগড়ায় জড়িয়ে পড়েছে। মিনিম্যাক্স M3 কি প্রকৃত পরীক্ষার মুখোমুখি হতে পারবে? বিশ্বব্যাপী ডেভেলপাররা ইতিমধ্যেই এটি ব্যবহার শুরু করেছেন।

সাম্প্রতিক সময়ে, ঘরোয়া এবং বিদেশী উভয় ক্ষেত্রেই একই মডেল দিয়ে সবকিছু ভরে গেছে।

540 লাখ ফলোয়ার সহ ভার্সেলের সিইও গিলেরমো রাউচ অত্যন্ত দুর্লভভাবে সমর্থন প্রকাশ করেছেন।

তিনি যে মডেলটি সুপারিশ করেছেন, তা হল একটি সম্পূর্ণরূপে চীনা মডেল—MiniMax M3।

তবে, একই M3-এর বিষয়ে অসন্তুষ্টির কথাও বেশি, অনেক দেশীয় সম্প্রদায়ের মন্তব্য বিভাগে সরাসরি বিতর্ক ছড়িয়ে পড়েছে।

অনেক মন্তব্যের সমালোচনা টোকেন প্ল্যানের মূল্য সমন্বয়ের উপর কেন্দ্রীভূত হয়েছে। অনেক পুরনো ব্যবহারকারী মনে করেন যে তাদের অধিকার কমে গেছে, এবং তারা বড় ঝগড়া শুরু করেছেন।

আর বিদেশী সম্প্রদায়ের স্টাইল তখন দেশীয় সম্প্রদায়ের সাথে সম্পূর্ণ ভিন্ন।

কিছু বিদেশি ডেভেলপার এম ৩ এর আর্কিটেকচার প্যারামিটার, স্পার্স অ্যাটেনশন মেকানিজম এবং ট্রেনিং ডেটা সাইজ অনুমান করছেন।

যেমন একজন ব্যবহারকারী রোহন বলেছেন, মূল্য শুধুমাত্র দেখলে কোনো অর্থ হয় না, যদিও খরচও গুরুত্বপূর্ণ, কিন্তু তিনি বেশি জানতে চান যে মডেলটি কিভাবে ভুল করে এবং এজেন্ট সিস্টেমে এর প্রকৃত পারফরম্যান্স কেমন।

অন্য একজন ব্যবহারকারী আরও সরাসরি মতামত দিয়েছেন, তিনি বলেছেন, "M3 একটি ওপেন-সোর্স মডেল হিসাবে Opus এবং GPT-5-এর পিছনে পিছনে ছুটছে, এটা খুবই অসাধারণ, কিন্তু আমি এই প্রচারগুলির উপর বিশ্বাস করার আগে নিজের চোখে দেখতে চাই যে এটি বাস্তবে কীভাবে ব্যর্থ হয়।"

এই বাহ্যিক মন্তব্যগুলির প্রতিক্রিয়ায়, মিনিম্যাক্স অফিসিয়ালি দ্রুত প্রতিক্রিয়া জানায় এবং ঐদিনই ক্ষতিপূরণ পরিকল্পনা প্রকাশ করে: পুরনো ব্যবহারকারীদের পুরনো সুবিধাগুলি বজায় রাখা হবে, এবং নতুন ব্যবহারকারীদের সপ্তাহিক সীমা 50% বৃদ্ধি করা হবে।

দামের বিষয়টি সমাধান হয়ে গেছে, এখন সবচেয়ে গুরুত্বপূর্ণ প্রশ্নটি হল: M3 কি সত্যিই শক্তিশালী, নাকি এটি শুধুমাত্র একটি "র্যাঙ্কিং করার" প্রতিবিম্ব?

72 ঘন্টা

বিশ্বব্যাপী ডেভেলপারদের জুড়ে ছড়িয়ে পড়া একটি 'হার্ডকোর ইনস্পেকশন'

একই প্রম্পট (একটি পেলিকানকে সাইকেল চালাতে দেখানোর জন্য এআইকে অ্যানিমেশন তৈরি করতে বলা) একইভাবে M3, Sonnet 4.6 এবং Opus 4.8-এর কাছে দেওয়া হয়েছিল, যা ডেভেলপার ভিক্টোরিয়া উ কর্তৃক M3-এর প্রকৃত পারফরম্যান্স যাচাইয়ের জন্য।

তারপর, তিনটি ফলাফলকে A, B, C হিসাবে চিহ্নিত করুন এবং ব্যবহারকারীদের অনুমান করতে দিন যে কোনটি M3।

কমেন্ট সেকশনে প্রায় সবকিছুই একদিকে, "A খুব স্মুথ ছিল, নিশ্চয়ই Opus", "M3 হওয়া উচিত B বা C".

ফলাফল প্রকাশিত। A হল M3।

একইভাবে, ডেভেলপার জাজি একটি ব্লাইন্ড টেস্ট লেভেলের কন্ট্রোল এক্সপেরিমেন্টও পরিচালনা করেছেন।

সে সম্পূর্ণ একই প্রম্পট ব্যবহার করেছিল যাতে মডেলটি HTML-এ Three.js ব্যবহার করে একটি মাইনক্রাফট ক্লোন শূন্য থেকে হাতে তৈরি করে, প্রতিযোগীদের মধ্যে ছিল M3 এবং Opus 4.8।

যদিও M3 কিছুটা বেশি সময় নেয়, শেষ কোড রান ফলাফলে, JAZII দুটি শব্দ দেয়: 「Super close」।

বামে M3, ডানে Opus 4.8, আপনি ঠিক অনুমান করেছেন কি?

একজন চীনা ডেভেলপার, "শিক্ষা ভাই minli" এক্স-এ, M3-এর মাল্টিমোডাল এবং এজেন্টিক কোডিং ক্ষমতাকে সর্বোচ্চ পর্যন্ত ব্যবহার করেছেন এবং M3 ব্যবহার করে একটি "সাধারণ মানুষের অধিকারের যাত্রা" হ্যান্ড গেম তৈরি করেছেন।

এই প্রক্রিয়ায়, M3-কে জটিল দৃশ্যমান হস্তচালনা বুঝতে হবে এবং অত্যন্ত দীর্ঘ পরিসরের লজিক্যাল কোড লিখতে হবে। একটি সম্পূর্ণ প্রবাহ চালানোর সময়, Token-এর খরচ মাত্র Claude Sonnet-এর 20%।

অত্যন্ত কঠোর পরিচিত এআই মূল্যায়নকারী থমাস উইগোল্ড প্রথম সময়েই একটি ৩০০০ শব্দের বাস্তব পরীক্ষার রিপোর্ট প্রকাশ করেছেন।

তিনি এম৩ সম্পর্কে মন্তব্য করেছেন: "এটি আমার বছরের মধ্যে পরীক্ষা করা সবচেয়ে আকর্ষণীয় মডেলগুলির একটি।"

গত ছয় মাস আগে ডিপসিক V4 প্রকাশের সময় থেকে চীনা মডেল সিলিকন ভ্যালির মধ্যে কোনো কম্পন তৈরি করেনি।

এবারের মিনিম্যাক্স M3-এর আঘাত আরও ত্রিমাত্রিক মনে হচ্ছে।

৫০ পৃষ্ঠের প্রবন্ধ ঢুকিয়ে দিন, M3 নিজেই ভাঙ্গবে

শুধু অন্যদের পরীক্ষা দেখে খুশি হওয়া যায় না। আমরা নিজেরাই হাত দিয়েছি, মডেলকে সবচেয়ে বেশি চাপ দেওয়ার জন্য দুটি সবচেয়ে কঠিন প্রশ্ন বাছাই করেছি।

প্রথমটি হল ৫০ পৃষ্ঠার ডিপসিক-ভি৩ প্রযুক্তিগত রিপোর্ট। চার্ট ঘন ঘন, সূত্র এবং প্রতিকৃতি কোড মিশে গেছে, তথ্যের ঘনত্ব সর্বোচ্চ।

প্রথমে, M3-কে «নিম্নস্তরের যোগাযোগ এবং গণনার ওভারল্যাপ» সম্পর্কিত কার্যকারণ প্রযুক্তিগত শৃঙ্খলটি স্পষ্ট করতে হবে, যাতে এই গবেষণাপত্রের সবচেয়ে কঠিন প্রকৌশল যুক্তিগুলি পরিষ্কারভাবে বুঝতে পারা যায়।

M3 পুরোপুরি 15 বার চিন্তা করেছে, 19টি কমান্ড বাস্তবায়ন করেছে এবং 1টি টুল কল করেছে।

এটি ডুয়ালপাইপ স্কিডিউলিং স্ট্র্যাটেজির সম্পূর্ণ বাস্তবায়ন পথটিকে স্পষ্টভাবে বিভক্ত করে দেয়, যার কোনো যুক্তিগত বিচ্ছিন্নতা নেই।

দেখতে স্লাইড করুন

পরবর্তী পরীক্ষা হবে M3-এর মাল্টিমোডাল ক্ষমতা।

একটি MLA স্ট্রাকচার ডায়াগ্রাম আপলোড করুন, তারপর মডেলকে চিত্রে ডায়নামিক স্কেডিউলিং এবং প্রজেকশন প্রক্রিয়াগুলির সাথে সম্পর্কিত পাঠ্যের কোন গাণিতিক সূত্রগুলি খুঁজে বের করতে বলুন।

এম৩ দ্রুত সঠিক ব্যাখ্যা দিয়েছে, সঠিকভাবে লক্ষ্য করেছে।

কঠিনতা আরও বাড়ছে। যদি চিত্রের কোনো লাইনের সাথে পাঠ্যের বর্ণনায় গভীরতর লুকানো সীমাবদ্ধতা লুকিয়ে থাকে, তাহলে M3-কে এটির চিত্রে দৃশ্যমান অবস্থান চিহ্নিত করতে হবে এবং এর পিছনের কারণটি ব্যাখ্যা করতে হবে।

M3 সরাসরি MLA আর্কিটেকচার ডায়াগ্রামে লেবেল যোগ করেছে এবং তিনটি সীমাবদ্ধতার বিস্তারিত বিশ্লেষণ দিয়েছে।

2 ঘন্টার একটি GTC স্পিচ, M3 সরাসরি প্রকাশ করেছে

দ্বিতীয় প্রশ্নের কঠিনতা বৃদ্ধি পেয়েছে, শুধু বুঝে নেওয়াই যথেষ্ট নয়, লিখে ফেলতে হবে।

এই ম্যাটেরিয়ালটি ছিল নভিডিয়া GTC কনফারেন্সের 1 ঘন্টা 57 মিনিটের পূর্ণাঙ্গ থিম স্পিচ, যা লেখার নিয়মসহ সবকিছু একসাথে M3-এর দিকে ফেলে দেওয়া হয়েছিল।

একটি প্রম্পট, ভিডিওটি দেখুন এবং নিয়ম অনুযায়ী ৩০০০-৪০০০০ শব্দের একটি গভীর প্রতিবেদন তৈরি করুন।

1.15GB মূল ভিডিওর সামনে সাধারণ AI টুলগুলি বেশিরভাগ ক্ষেত্রে ত্রুটি দেখাবে এবং পিছনে সরে যাবে।

কিন্তু মিনিম্যাক্স কোড সিস্টেম-লেভেল টুলকিটের সহায়তায়, এম৩ তাত্ক্ষণিকভাবে সমাধান খুঁজে পেল—

ffmpeg ব্যবহার করে কম্প্রেস এবং সেগমেন্ট করা হয়েছে, নিজের জন্য একটি কার্যকরী পথ তৈরি করা হয়েছে।

12টি সেগমেন্ট খাওয়ার পরে, M3 একটি অসাধারণ মেটারিয়াল লিস্ট প্রদান করেছে।

সময় মিনিট পর্যন্ত সঠিক, চিত্রের বিস্তারিত অত্যন্ত সূক্ষ্মভাবে ধরা হয়েছে।

লো হুয়াং-এর স্কেল-টেক্সচারযুক্ত কালো লেদার জ্যাকেট, প্যান্টের পকেট থেকে N1X চিপ বের করে মাথার উপরে ১৫ সেকেন্ড ধরে তুলে ধরা, এবং ভেরা রুবিনের বাস্তব মডেলটি মঞ্চে নিয়ে আসার সময় “পিছনে প্রায় ২০০০ জন প্রস্রাব করছে” বলে মজা করা—এগুলো সবই অন্তর্ভুক্ত।

পুরনো হুয়াং হঠাৎ বলা সেই চীনা বাক্যটি “খুব বেশি জিনিস” ও এটি উপেক্ষা করেনি।

আরও শক্তিশালী হিসাবে, এম৩ নিজের মনে করে যে এই পুরো ইভেন্টের সবচেয়ে বড় তিনটি পয়েন্ট নিয়ে প্রতিটির জন্য নিজস্ব যুক্তি দিয়েছে।

সামগ্রীর তালিকা নিশ্চিত করার পর, M3 লেখা শুরু করে।

প্রারম্ভিক দৃশ্যে পুরনো হুয়াং তার প্যান্টের পকেট থেকে জিনিস বার করছে, শেষে উঠে আসছে এই ধারণা: "এই শিল্প শৃঙ্খলের মালিক, মানুষ থেকে Agent-এ পরিণত হচ্ছে।"

৩৫০০ শব্দের প্রাথমিক সংস্করণ, ৪০ মিনিটে পরীক্ষা শেষ।

এটি আমাদের প্রকাশনার মানের সাথে এখনও মাপামাপি করতে পারে না, তবে এটি যথেষ্ট উচ্চ মানের একটি শুরু প্রদান করে।

দুই ঘন্টার ভিডিও দেখার পর মাল্টিমোডাল, দীর্ঘ কনটেক্সট সমস্ত মেটেরিয়াল + লেখার নিয়ম + নমুনা একই উইন্ডোতে রাখে, এজেন্টের ক্ষমতা যা দরকার তা সমাধান করে।

এই কাজে M3-এর তিনটি মূল ক্ষমতা সম্পূর্ণরূপে চরম সীমায় প্রয়োগ করা হয়েছে, যেকোনো একটি অনুপস্থিত হলে এটি সম্ভব হত না।

12টি মডেলের রিপোর্ট, M3 নিজেই একটি প্যানোরামিক চিত্র তৈরি করেছে

তৃতীয় প্রশ্নটি একটি ভিন্ন দিকে নিয়ে যান, দীর্ঘ টেক্সট নয়, চিত্র পড়া, ইন্টারনেট ব্যবহার এবং ইঞ্জিনিয়ারিং করা নিয়ে পরীক্ষা করুন।

প্রতিটি মডেল প্রকাশের সময় একটি বেঞ্চমার্ক তুলনামূলক চিত্র প্রকাশ করা হয়, কিন্তু ফরম্যাটগুলি বিভিন্ন—টেবিল, বার চার্ট, রাডার চার্ট—এবং ডেটা মেট্রিক্সও একরকম নয়।

অনুভূত তুলনা করতে হলে নিজের হাতে প্রতিটি পৃষ্ঠা উল্টাতে হবে এবং প্রতিটি বক্স মিলিয়ে দেখতে হবে, যা অত্যন্ত কষ্টকর।

এই বার মূলত বিভিন্ন মডেলের অফিসিয়াল ব্লগ এবং তৃতীয় পক্ষের মূল্যায়ন প্ল্যাটফর্ম থেকে দশটি বেঞ্চমার্ক স্ক্রিনশট M3-এর কাছে পাঠানো হয়েছে, যাতে এটি নিজেই সমস্ত গ্রাফ বুঝতে পারে, ইন্টারনেটের মাধ্যমে অনুপস্থিত ডেটা পূরণ করে, একই মানদণ্ডে সাজিয়ে একটি ইন্টারঅ্যাকটিভ তুলনামূলক ড্যাশবোর্ড তৈরি করে।

এম৩ প্রথমে স্ক্রিনশটের মডেলের নাম এবং স্কোর একটি একটি করে চিনতে হবে। ভিন্ন ফরম্যাটের গ্রাফের সাথে সামঞ্জস্য রাখতে নিজে নরমালাইজেশন করুন। স্ক্রিনশটে অনুপস্থিত ডেটা সরাসরি অফিসিয়াল সোর্সের মাধ্যমে অনলাইনে খুঁজে পূরণ করুন।

একটি ব্লুমবার্গ টার্মিনাল স্টাইলের ডার্ক থিম ইন্টারেক্টিভ বড় স্ক্রিন তৈরি করা হয়েছে।

১২টি মডেল, ১৪টি বেঞ্চমার্ক, কম্প্রিহেনসিভ র্যাঙ্কিং, রেডার চার্ট তুলনা, একক বার চার্ট, মূল্য/পারফরম্যান্স স্ক্যাটার প্লট—চারটি মডিউল একসাথে।

তিনটি ক্ষমতা, একবারে পূর্ণ প্রস্তুত

তিনটি প্রশ্ন সমাধান করার পর, M3-এর ক্ষমতার সীমানা স্পষ্ট হয়ে গেল। এখন প্রশ্ন হলো, এটি কিভাবে এটি করেছে।

উত্তরটি হল তিনটি মূল ক্ষমতা একসাথে উপস্থিত: অগ্রগামী প্রোগ্রামিং, 1M কনটেক্সট উইন্ডো এবং নেটিভ মাল্টিমোডাল।

এর ভিত্তি হল একটি নতুন মনোযোগ আর্কিটেকচার, যার নাম MiniMax Sparse Attention (MSA)।

লক্ষ পরিমাণ প্রসঙ্গ প্রক্রিয়াকরণের সময় পারম্পরিক মনোযোগ ব্যবস্থা গণনার পরিমাণ সূচকীয়ভাবে বিস্ফোরিত হয়, যার ফলে GPU-এর VRAM এবং গণনা ক্ষমতা সম্পূর্ণরূপে শোষিত হয়ে যায়।

MSA ব্লক-লেভেল স্পার্সিটি ব্যবহার করে এই বোতলের গলা দূর করেছে।

অপারেটর লেয়ারে, এটি প্রতিটি KV ডেটা ব্লককে মেমোরিতে শুধুমাত্র একবার পড়তে দেয়, মেমোরি অ্যাক্সেস সম্পূর্ণরূপে কন্টিনিউয়াস হয় এবং কোনো পুনরাবৃত্তি কপি করা হয় না।

প্রভাবটি শুধুমাত্র হিংস্রতার দ্বারা বর্ণনা করা যায়।

100 লক্ষ কনটেক্সটের ভয়ঙ্কর স্কেলে, M3-এর প্রতিটি টোকেনের ক্যালকুলেশন পূর্বপুরুষের 1/20 এ চাপা পড়েছে। প্রিফিল স্পিড-আপ হয়েছে 9 গুণেরও বেশি, ডিকোডিং স্পিড-আপ হয়েছে 15 গুণেরও বেশি।

মাল্টিমোডাল পাশেও একই রকম কঠোর। M3 কোনও প্রথমে টেক্সট ট্রেন করে তারপর ভিজুয়াল মডিউল যুক্ত করা জটিল পণ্য নয়।

এটি প্রশিক্ষণের প্রথম ধাপ থেকেই টেক্সট, ছবি এবং ভিডিও একসাথে দেওয়া হয়েছে। এর জন্য গবেষণা দলটি সম্পূর্ণ ডেটা পাইপলাইন পুনর্গঠন করেছে এবং প্রি-ট্রেনিং স্কেলকে সরাসরি 100T লেভেলে নিয়ে গিয়েছে।

ফলাফল হিসেবে, M3 এর পারফরম্যান্স অ্যার্টিফিশিয়াল অ্যানালিসিস কম্প্রিহেনসিভ ইন্টেলিজেন্ট ইনডেক্সে ওপেন সোর্স মডেলগুলির মধ্যে বিশ্বের সর্বোচ্চ র‍্যাঙ্কিং অর্জন করেছে এবং বিশ্বব্যাপী ৭ম স্থানে রয়েছে।

GPQA ডায়মন্ড বৈজ্ঞানিক যুক্তি র‍্যাঙ্কিংয়ে, M3 93.2% স্কোর করে বিশ্বের শীর্ষ 4-এ প্রবেশ করেছে, যা Claude Opus 4.8 এবং Opus 4.7-এর চেয়ে বেশি।

দীর্ঘ প্রেক্ষাপট যুক্তি তালিকায়, M3 74.0% স্কোর নিয়ে শীর্ষ ছয়ের মধ্যে জায়গা করে নিয়েছে এবং GPT-5 সিরিজের সাথে প্রতিদ্বন্দ্বিতা করছে।

GDPval-AA বাস্তব কাজ এজেন্ট র্যাঙ্কিংয়ে, M3-এর 1670 পয়েন্ট বিশ্বের পঞ্চম স্থানে এবং Sonnet 4.6 থেকে মাত্র 6 পয়েন্ট পিছনে।

প্রতিটি লিস্টের মূল্যায়ন মাপদণ্ড ভিন্ন, কিন্তু M3 সর্বদা একই ব্যবধানে থাকে, বন্ধ সোর্সের প্রথম দলের সীমানায় এবং ওপেন সোর্স মডেলগুলির সবচেয়ে আগে।

দেখতে স্লাইড করুন

পরিচিত তৃতীয় পক্ষের মাল্টিমোডাল তালিকা Vals Index-এ, M3 বিশ্বের ষষ্ঠ স্থানে উঠে এসেছে।

এটি বর্তমানে চীনের অ্যাপের সেরা পারফরম্যান্স এবং ওপেন-সোর্স মডেলগুলির মধ্যে বিশ্বের সর্বোচ্চ র‍্যাঙ্কিং।

মোটামুটি অনুভূতি অনুযায়ী, M3 এখন স্থিরভাবে Claude Sonnet 4.6 এর সীমানা পার হয়ে গেছে।

যদিও এটি সবচেয়ে শক্তিশালী Opus 4.7 এবং GPT-5.5 এর থেকে একটু পিছিয়ে, তবুও এটি অন্তত মৃত্যুর গ্রুপে প্রবেশ করেছে।

একটি এজেন্ট যথেষ্ট নয়, তাহলে একটি দল ব্যবহার করুন

এরপরের প্রাকৃতিক প্রশ্নটি হলো, এই মডেলটি চালানোর জন্য কী ব্যবহার করবেন?

পূর্বের পরীক্ষায় M3 দিয়ে ffmpeg ব্যবহার করে ভিডিও কাটা এবং 40 মিনিটে আউটপুট তৈরি করা হয়েছিল, যা MiniMax Code-এ চালানো হয়েছিল।

কিন্তু এখনও শুধু একটি এজেন্ট কাজ করছে। এই আপগ্রেডের সবচেয়ে আলোচনার বিষয় হলো এজেন্ট টিম।

AI প্রোগ্রামিং টুল ব্যবহার করা ব্যক্তিদের মধ্যে এই অভিজ্ঞতা প্রায়শই দেখা যায়।

আপনি এজেন্টকে ৭টি কাজ দিয়েছেন, সে তিনটি শেষ করে থামে এবং রিপোর্ট করে, "আমি ১, ২, ৩ শেষ করেছি, কি করতে হবে?" অথবা হঠাৎ করে স্টাইল পরিবর্তন করে, আগে এটি একজন বিশ্বস্ত ইঞ্জিনিয়ারের মতো কাজ করছিল, কিন্তু পরে হঠাৎ অসংগঠিত কথা বলতে শুরু করে।

এই বিষয়ে, এজেন্ট টিম বিচারক এবং খেলোয়াড়দের আলাদা করে দিয়েছে।

লিডার লক্ষ্য বুঝতে, কাজ বিভক্ত করতে এবং সমন্বয় করতে দায়ী। ওয়ার্কার বিশেষ কাজ করে, বিভিন্ন ওয়ার্কারের ভিন্ন ভিন্ন টুল এবং প্রেক্ষাপট থাকে। ভেরিফায়ার পরীক্ষা করে, যা ওয়ার্কারের বিরুদ্ধে কাজ করে।

কর্মী কাজ শেষ করেছে, যাচাইকারী ত্রুটি খুঁজতে শুরু করেছে। সমস্যা খুঁজে পেলে, কাজটি ফেরত দেওয়া হয় এবং পুনরায় করতে হয়। যাচাইকারী যাচাই শেষ করলে, কর্মী সংশোধনের পরামর্শ নিয়ে আবার শুরু করে। এই প্রতিদ্বন্দ্বিতামূলক চক্রটি মডেলের নিজস্ব সিদ্ধান্তের উপর নির্ভর করে না যে কখন থামবে; এর নিচে একটি স্টেট মেশিন ইঞ্জিন কাজ করছে।

সবচেয়ে বেশি আনন্দদায়ক অভিজ্ঞতা হলো, আপনি একটি বার্তা পাঠান, M3 সেকেন্ডের মধ্যে নিশ্চিতকরণ দেয়, এবং একসাথে ব্যাকএন্ডে একাধিক Worker সমান্তরালভাবে চলতে শুরু করে।

আপনি মাঝে মাঝে একটি নতুন প্রয়োজনীয়তা যোগ করেন, «একসাথে এটি চেক করে দিন», লিডার তৎক্ষণাৎ প্রতিক্রিয়া জানান, ব্যাকগ্রাউন্ড টাস্ক বন্ধ হয় না।

একজন সহকর্মীর মতো যে আপনার উইচ্যাটে সেকেন্ডে রিপ্লাই করে এবং আপনার কাজও করে।

M3-এর মডেল ক্ষমতা এবং MiniMax Code-এর এজেন্ট টিম—একটি চিন্তার জন্য দায়ী, অন্যটি কাজের জন্য দায়ী, এই দুটির সমন্বয়ে অসীম কল্পনার সূচনা হয়েছে।

বিবাদের পর, সবার মনোযোগ আবার এখন M3-এর দিকে ফিরে এসেছে।

এবং এরপর, সত্যিকারের গুরুত্বপূর্ণ পদক্ষেপটি আসছে: এর ওজন এবং সম্পূর্ণ প্রযুক্তিগত রিপোর্ট দশ দিনের মধ্যে ওপেন সোর্স হবে।

তখন বিশ্বব্যাপী ডেভেলপাররা এটিকে বাস্তব প্রকল্প দিয়ে স্কোর দেবে।

ASI-এর জন্য সেকেন্ড অনুসরণ করুন

⭐ লাইক, শেয়ার এবং দেখুন—একক্লিকে তিনটি কাজ করুন ⭐

স্টার চিহ্নটি সক্রিয় করুন এবং নিউ এইটিএম দ্রুত পুশ নোটিফিকেশন চিহ্নিত করুন!

পূর্ববর্তী লেখা

বিশেষজ্ঞরা বছরের শেষের দিকে আসতে বলেছিলেন, কিন্তু Claude Mythos আজই 3 ঘন্টা 6 মিনিটে চলে গেল!

পরবর্তী পৃষ্ঠা আর্টিকেল

অ্যানথ্রোপিক-এর অভ্যন্তরীণ 95% ব্যবসায়িক বিশ্লেষণ Claude-এর হাতে দেওয়া হয়েছে, এবং এর রহস্য শক্তিশালী মডেলের বাইরে।

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।