দেশীয় এআই কোম্পানিগুলি নিজেদের পথ তৈরি করার চেষ্টা শুরু করেছে।
বছরের শুরুতে, বিদেশি প্রযুক্তি জগত চীনের ক্যালকুলেশন ক্ষমতা নিয়ে মনোযোগ দিচ্ছে।
জানুয়ারিতে, মাস্ক একটি পডকাস্টে বলেছিলেন যে চীন এআই ক্ষমতায় "বিশ্বের অন্যান্য সব অঞ্চলকে অনেক বেশি ছাড়িয়ে যাবে।" ফেব্রুয়ারিতে, ওপেনএআই-এর সিইও অটাম্যান বলেছিলেন যে চীনের কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে প্রযুক্তিগত উন্নতি "অবিশ্বাস্যভাবে দ্রুত"। নভিডিয়ার সিইও হুয়াং রেনক্সও বারবার প্রকাশ্যে বলেছেন: "চীনের এআই প্রযুক্তির উপর সীমাবদ্ধতা আরোপ করলে এটি তাদের নিজস্ব গবেষণা-উন্নয়নকে ত্বরান্বিত করবে।"
২০২৫ সালকে সরবরাহ প্রান্তের সমাবেশের বছর বলা যেতে পারে। মোয়ালিনটেন, মু সি শেয়ারসহ স্থানীয় GPU গুলি ক্রমাগত বিনিয়োগকারী বাজারে প্রবেশ করেছে, যা স্থানীয় বড় মডেলের শিল্পভিত্তিকে আরও গভীর করেছে। ২০২৬ সালে, পরিবর্তনগুলি শিল্প শৃঙ্খলের নিচের দিকে ছড়িয়ে পড়ে, এবং এপ্রিলের শেষের দিকে, একাধিক স্থানীয় বড় মডেল নতুন সংস্করণ প্রকাশ করে।
২০ এপ্রিল, মুন অফ দ্য ডার্ক কিমি K2.6 মডেল প্রকাশ করে যা দীর্ঘ কোড লেখার জন্য দক্ষ; ২৪ এপ্রিল, ডিপসিক V4 প্রকাশিত হয়; তারপর মেইটুয়ানের LongCat-2.0-Preview টেস্টিংয়ের জন্য উন্মুক্ত হয়, উভয়েরই মোট প্যারামিটার স্কেল এক ট্রিলিয়নের বেশি এবং উভয়ই 1M অত্যন্ত দীর্ঘ কনটেক্সট সমর্থন করে।
উল্লেখযোগ্য যে, ডিপসিক V4 নিউডেক সিস্টেম থেকে হুয়াওয়ে শেংটেং প্ল্যাটফর্মে স্থানান্তর ও অ্যাডাপ্টেশন সম্পন্ন করেছে; আর মেইটুয়ান লংক্যাট 2.0 হল একটি ট্রিলিয়ন প্যারামিটারের বড় মডেল যা সম্পূর্ণরূপে দেশীয় ক্যালকুলেশন পাওয়ারের উপর ভিত্তি করে প্রশিক্ষণ ও উপস্থাপনা করা হয়েছে, যাতে ৫০,০০০ থেকে ৬০,০০০টি দেশীয় ক্যালকুলেশন চিপ ব্যবহার করা হয়েছে।
দীর্ঘ সময় ধরে, চীনা এআই পেশাদারদের সাধারণ কৌশল ছিল প্রাপ্ত পরিপক্ক সমাধানগুলির উপর নির্ভর করা। এখন, দেশীয় এআই প্রতিষ্ঠানগুলি নিজেদের পথ প্রশস্ত করার চেষ্টা করছে।
বনের মধ্যে রাস্তা তৈরি করা
আপনি কীভাবে একটি কঠিন কাজ সম্পন্ন করবেন?
বিজ্ঞান কল্পনা লেখক আর্থার সি. ক্লার্কের উত্তর ছিল: "একমাত্র উপায় হল অসম্ভবকেই এগিয়ে যাওয়ার শুরু করে দেওয়া।"
ডিপসিক V4-এর প্রাথমিক তারিখ থেকে চূড়ান্ত প্রকাশ পর্যন্ত, সময় বারবার পরিবর্তন করা হয়েছিল। বাহ্যিকভাবে অনুমান করা হয়েছে যে এর একটি কারণ হল মূল কোডকে নভিডিয়ার CUDA থেকে সরিয়ে আনা।
কুডা ইকোসিস্টেম দশকের প্রচেষ্টার মাধ্যমে একটি শক্তিশালী এবং সম্পূর্ণ টুলসযুক্ত ডেভেলপমেন্ট প্ল্যাটফর্মে পরিণত হয়েছে। দেশীয় কম্পিউটিং ইকোসিস্টেম এখনও গঠনের প্রাথমিক পর্যায়ে। কোড মাইগ্রেশনের প্রক্রিয়াটি বিকাশকারীদের জন্য বহু লো-লেভেল ফ্রেমওয়ার্ক পুনর্গঠনের কাজ করতে হবে।
শেষ পর্যন্ত ডিপসিক এটি করেছে, ভি৪ প্রকাশের দুই দিন পর, জেপি মরগ্যান একটি রিপোর্টে উল্লেখ করেছে যে ভি৪ সফলভাবে হুয়াওয়ে আসেন চিপসের সাথে সামঞ্জস্যপূর্ণ হয়েছে, যা স্থানীয় কম্পিউটিং ক্ষমতার অগ্রণী এআই ইনফারেন্সের জন্য সম্ভাবনা প্রমাণ করে; এবং ডিপসিক মিক্সড অ্যাটেনশন আর্কিটেকচারের মতো নিম্নস্তরের প্রযুক্তিগত উদ্ভাবনের মাধ্যমে ইনফারেন্স খরচ উল্লেখযোগ্যভাবে কমিয়েছে।
ডিপসিক একটি টেক এনথুসিয়াস্টের পদ্ধতিতে খরচ কমিয়ে দক্ষতা বাড়ায়, একটি বড় মডেলের অর্ধেক কাজ পুনর্লিখন করে কঠোর মাইগ্রেশন সম্পন্ন করে। একই দিনে পরীক্ষামূলকভাবে উন্মুক্ত মেইটুয়ান LongCat-2.0-Preview সরাসরি দেশীয় ক্যালকুলেশন ইনফ্রাস্ট্রাকচারের উপর চলছে।
প্রকৌশল পর্যায়ে দেশীয় ক্যালকুলেশন ক্ষমতার কী কী চ্যালেঞ্জ রয়েছে? LongCat-2.0-Preview-এর উদাহরণ দিয়ে দেখা যাক।
প্রথম চ্যালেঞ্জটি পদার্থবিদ্যাগত। দেশীয় হার্ডওয়্যার প্ল্যাটফর্মের ভিডিও মেমোরি ক্ষমতা এবং ব্যান্ডউইথ নভিডিয়া চিপের সাথে পার্থক্য রয়েছে, ট্রিলিয়ন প্যারামিটার মডেল ট্রেনিং এবং ডিপ্লয়মেন্টের সময়, মেইটুয়ান দলকে ইঞ্জিনিয়ারিংয়ের ক্ষেত্রে বড় চ্যালেঞ্জের মুখোমুখি হতে হয়েছিল, যার জন্য তাদের প্যারালাল স্ট্র্যাটেজি ডিবাগ করতে এবং ভিডিও মেমোরি অপ্টিমাইজ করতে আরও বেশি পরিশ্রম করতে হয়েছিল।
দ্বিতীয় চ্যালেঞ্জ হল সফটওয়্যার ইকোসিস্টেমের পরিপক্কতা; দেশীয় চিপের বৈশিষ্ট্যগুলির সাথে সামঞ্জস্য রেখে প্রশিক্ষণের সম্পূর্ণ প্রক্রিয়ার সঠিক পুনরাবৃত্তি নিশ্চিত করতে, দলটিকে কোর অপারেটরগুলি পুনরায় লিখতে এবং অপ্টিমাইজ করতে হবে, এবং সম্পূর্ণ নির্ধারণমূলক অপারেটরগুলি নিজস্বভাবে ডিজাইন করতে হবে।
তৃতীয় চ্যালেঞ্জটি ছিল লাখ কার্ড ক্লাস্টারের স্থিতিশীলতা; ৫০,০০০ থেকে ৬০,০০০টি স্থানীয় ক্যালকুলেশন কার্ড ব্যবহার করে অতিবৃহৎ ক্লাস্টারে হার্ডওয়্যার ব্যর্থতা এড়ানো যায় না। এর জন্য, দলটি একটি সম্পূর্ণ ত্রুটি-সহিষ্ণুতা এবং স্বয়ংক্রিয় পুনরুদ্ধার ব্যবস্থা তৈরি করেছে।
শেষ পর্যন্ত, দলটি স্থানীয় হার্ডওয়্যারের বৈশিষ্ট্যগুলির উপর ভিত্তি করে প্রশিক্ষণ ফ্রেমওয়ার্ক এবং মডেল স্ট্রাকচারের জন্য উপযুক্ত ডিজাইন করেছে, যা সাধারণ ফ্রেমওয়ার্কের সামঞ্জস্যতার সীমাবদ্ধতা ভাঙল এবং গণনা কর্মক্ষমতা বৃদ্ধি করল।
ডিপসিকের অ্যালগরিদম অপ্টিমাইজেশন ক্যালকুলেশন প্রয়োজনীয়তা কমিয়ে দেয় এবং মডেলের দাম কমিয়ে দেয়; মেইটুয়ানের ইঞ্জিনিয়ারিং প্র্যাকটিস দেখায় যে দেশীয় চিপগুলির সম্ভাবনা রয়েছে। এই অনুসন্ধানগুলি দেশীয় চিপ ইকোসিস্টেমকে ইঞ্জিনিয়ারিং ক্ষমতা এবং অভিজ্ঞতা জমা করতে সাহায্য করেছে।
লিয়াং উয়েনফেং বলেছিলেন: "আমরা ইচ্ছাকৃতভাবে একটি শুঁটকি মাছ হওয়ার চেষ্টা করিনি, শুধু অকস্মাৎ একটি শুঁটকি মাছ হয়ে গেছি," এবং এখন "শুঁটকি মাছের প্রভাব" প্রকাশ পেয়েছে, ডিপসিক একা নয়।
একক বিন্দু থেকে সিস্টেম পর্যন্ত
টেনসেন্ট ক্লাউডের টাং ডাওশেং একটি উপমা দিয়েছিলেন: "বড় মডেল হল ইঞ্জিন, ব্যবহারকারী হল ড্রাইভার।" ব্যবহারকারীরা সহজেই ইঞ্জিনের পারফরম্যান্স লক্ষ্য করে, কিন্তু একজন দক্ষ ড্রাইভার বুঝতে পারেন যে জ্বালানি এবং চ্যাসিসও একই পরিমাণে গুরুত্বপূর্ণ।
চীনের ক্যালকুলেশন ক্ষমতার উন্নয়ন নির্ভর করে সম্পূর্ণ শিল্প শৃঙ্খলের সমন্বিত প্রগতির উপর। প্রতিটি ধাপের প্রধান কোম্পানিগুলি নিয়মিত দুর্বলতা পূরণ করছে।
উৎপাদন প্রান্তে, প্রকাশিত তথ্য দেখায় যে চীনের চিপ উৎপাদন ধাপে ধাপে বৃদ্ধি পাচ্ছে, কিন্তু এটি একটি "ডাম্বেল-আকৃতির" কাঠামো, যেখানে 28nm-এর বেশি পরিপক্ক প্রক্রিয়াটি প্রধান ভূমিকা পালন করে এবং 14nm এবং তার নিচের উন্নত প্রক্রিয়ার উৎপাদন ক্ষমতা এখনও সীমিত।
ইউভি লিথোগ্রাফি মেশিনের অভাবের বাস্তবতার মুখোমুখি হয়ে, সিএমসিসি এবং হুয়াহং সেমিকন্ডাক্টর সহ বিভিন্ন প্রতিষ্ঠান মাল্টিপল এক্সপোজার প্রক্রিয়ার উন্নয়নে কাজ করছে, যাতে ভৌত সীমার মধ্যে ভারসাম্য বজায় রাখা যায়। বিভিন্ন প্রতিবেদনে দেখা যায় যে, সিএমসিসির N+2 প্রক্রিয়া (7nm-এর সমতুল্য) এর উৎপাদন ক্ষমতা 80% এর ঊর্ধ্বে পৌঁছেছে, যা বাণিজ্যিক পরিমাণে উৎপাদনের সীমানা অতিক্রম করেছে।
ক্যালকুলেশন পাওয়ার দিকে, স্থানীয় চিপগুলি এখনও নভিডিয়ার তুলনায় একক কার্ডের ক্যালকুলেশন ক্ষমতায় পার্থক্য রাখে। হুয়াওয়ে শেংটেং 910সি-এর মতো পণ্যগুলির ব্যবহার দেখায় যে, চরম ক্লাস্টার লিনিয়ার স্পিড-আপ অনুপাতের মাধ্যমেও বিশাল মডেল ট্রেনিং চালানো সম্ভব।
"প্রজেক্ট ইকোসিস্টেম জয় করলেই বিশ্ব জয় করা যায়।" নভিডিয়া CUDA-এর গভীর প্রতিরক্ষামূলক সীমানা গড়ে ওঠার একটি প্রধান কারণ হল এটি সার্বজনীন সফটওয়্যার-হার্ডওয়্যার সামঞ্জস্যতার মানক তৈরি করেছে।
শিল্পের পেশাদাররাও এটি বুঝতে পেরেছেন। উদাহরণস্বরূপ, Cambricon মূল সফটওয়্যার প্ল্যাটফর্ম চালু করেছে যা প্রধান ফ্রেমওয়ার্কগুলির সাথে সামঞ্জস্যপূর্ণ, যা ডেভেলপারদের স্থানান্তরের বাধা কমিয়েছে। Zhixuan আর্টিফিশিয়াল ইন্টেলিজেন্স ইনস্টিটিউটের নেতৃত্বে তৈরি ওপেন-সোর্স সিস্টেমটি একটি একক নিম্ন-স্তরের ইন্টারফেস তৈরি করেছে, যার ফলে উপরের মডেলগুলি বিভিন্ন ধরনের দেশীয় চিপগুলিতে চলতে পারে।
দেশীয় ইন্টারনেট বড় কোম্পানিগুলিও অনেক কাজ করছে, বাইডুর ডুয়াল-ট্র্যাক কৌশল এবং জিটিয়ান্ডির কিলোবিলিয়ন ডলারের বিনিয়োগ উভয়ই ক্যালকুলেশন বেসিসের জন্য আরও ভালো সমাধান খুঁজছে।
প্রকাশিত তথ্য অনুযায়ী, গত কয়েক বছরে মেইটুয়ান কমপক্ষে ২১টি সেমিকন্ডাক্টর/স্মার্ট হার্ডওয়্যার এবং জেনারেল লার্জ মডেল ক্ষেত্রের সংশ্লিষ্ট কোম্পানিতে বিনিয়োগ করেছে। এর মধ্যে চিপ ক্যালকুলেশন স্তরের মোহুয়ান লাইনটেন, মুসি শেয়ারস, এবং ভিজুয়াল চিপ ক্ষেত্রের আইশিন ইয়ুনজি; এছাড়াও নতুন উপাদানসহ বিভিন্ন উপ-ক্ষেত্রের গুয়াংজৌ জংশান, ওয়াংফং ক্যালকুলেশন চিপসসহ অনেকগুলি প্রতিষ্ঠান অন্তর্ভুক্ত।
প্রযুক্তিগতভাবে নিয়মিত অগ্রগতি রক্ষা করার সাথে সাথে, শিল্প মূলধনও ক্যালকুলেশন ক্ষমতার বিনিয়োগকারী এবং সহ-নির্মাতা হিসেবে কাজ করছে, যা ধীরে ধীরে একটি ইতিবাচক চক্র গঠন করছে।
ডিজিটাল বিশ্ব থেকে বাস্তব কাজে
বর্তমানে কৃত্রিম বুদ্ধিমত্তা তৃতীয় ঢেউয়ের একটি গুরুত্বপূর্ণ মোড়ে রয়েছে, বড় মডেলগুলি এটিকে দুর্বল কৃত্রিম বুদ্ধিমত্তা থেকে সাধারণ কৃত্রিম বুদ্ধিমত্তার দিকে নিয়ে যাচ্ছে, এবং আরও গুরুত্বপূর্ণভাবে, রোবটগুলিকে 1.0 স্পেসিফিক রোবট যুগ থেকে 2.0 জেনারেল এমবডিড ইন্টেলিজেন্স যুগের দিকে নিয়ে যাচ্ছে।
বিজিং জিহুয়ান আর্টিফিশিয়াল ইন্টেলিজেন্স ইনস্টিটিউটের প্রধান ওয়াং জংয়ুয়ানের মতে, এআই ক্ষমতার গুরুত্বপূর্ণ প্রয়োগ হল ভৌত বিশ্ব।
একদিকে, অনেক চীনা প্রস্তুতকারক মডেলগুলিকে ক্লাউডে "হাজার হাজার বই পড়তে" সক্ষম করার উপর জোর দিচ্ছেন, যাতে মডেলের বুদ্ধিমত্তা এবং যৌক্তিক যুক্তির নির্ভুলতা বৃদ্ধি পায়। অন্যদিকে, মডেলগুলিকে "হাজার হাজার মাইল ভ্রমণ করতে"ও সক্ষম করা হচ্ছে; উদাহরণস্বরূপ, উেনশিন মডেলটি অটোনোমাস ড্রাইভিং ডিসিশন সিস্টেমে এমবেড করা হয়েছে; হুনইয়ান মডেলের ইন্ডাস্ট্রিয়াল কোয়ালিটি চেকিং সলিউশনগুলি এখন বিভিন্ন লাইনের স্কেনারিওতে ব্যবহার হচ্ছে।
মেইটুয়ানের ফুড ডেলিভারি, স্টোর-ভিত্তিক সেবা, হোটেল এবং যাত্রা ইত্যাদি ব্যবসাগুলি দৈনন্দিন জীবনের সবচেয়ে জটিল কার্য বাস্তবায়ন নেটওয়ার্ক গঠন করে। এখানে অসংখ্য বাস্তব পরিস্থিতি রয়েছে: ব্যবসায়ীদের রান্নাঘরের খাবার প্রস্তুতির গতি, থাকা বৃষ্টিতে ডেলিভারি কর্মচারীদের পথ, এবং ব্যবহারকারীদের রাতের একটি "আমি হটপট খেতে চাই" বার্তা।
ওয়াং ইং স্পষ্টভাবে উল্লেখ করেছিলেন যে মেইটুয়ান অ্যাপটিকে প্রথমেই «AI-পাওয়ার্ড অ্যাপ»-এ আপগ্রেড করতে হবে। এর অর্থ হলো, লংক্যাটের প্রশিক্ষণের লক্ষ্য শুধুমাত্র «কোন রেস্তোঁরার ছোট মাংস সুস্বাদু» এই প্রশ্নের উত্তর দেওয়া নয়, বরং «সেই রেস্তোঁরাটি খুঁজে বার করা, সেরা গ্রুপ ডিল কুপনটি নির্বাচন করা, এবং পরবর্তী দুটি শুক্রবারের সন্ধ্যা ৭টায় দুটি আসন বুকিং করা»।
এর অর্থ হল কাজের বাস্তবায়নের প্রভাব খুবই গুরুত্বপূর্ণ, এবং এটিই ব্যাখ্যা করে যে কেন মেইটুয়ান ভৌত বিশ্বের জন্য এআই ভিত্তি তৈরির উপর জোর দিচ্ছে।
প্যারামিটার থেকে ক্যালকুলেশন পাওয়ার পর্যন্ত, দেশীয় বড় মডেলগুলি এখন 'ব্যবহারযোগ্য' থেকে 'সহজে ব্যবহারযোগ্য'-এ উন্নীত হচ্ছে।
এই পথে কোনো সংক্ষিপ্ত পথ নেই। ভবিষ্যতে, যখন অ্যালগরিদম, কম্পিউটিং পাওয়ার, ফান্ডিং এবং স্কেনারিও নিরন্তর রাসায়নিক বিক্রিয়া ঘটাবে, চীনের এআই-এর গল্পও 'একক বিন্দুর বিচ্ছিন্নতা' থেকে 'সিস্টেমের উন্নয়ন'-এর পাতায় উল্টে যাবে।
এই প্রবন্ধটি ওয়েইচ্যাট গ্রুপ "ল্যানডোং বিজনেস" থেকে এসেছে, লেখক: ইউ ওয়েইলিন
