এই প্রবন্ধটি বিশ্বের বড় কোম্পানিগুলির নিজস্ব ডিজাইন করা এআই চিপের বর্তমান বিন্যাসের গভীর বিশ্লেষণ করবে, অর্থনীতি এবং মৌলিক প্রযুক্তিগত যুক্তি থেকে যুক্তি দেখাবে যে কেন প্রযুক্তি বড়দের জন্য নিজস্ব চিপে বড় অর্থ বিনিয়োগ করা অপরিহার্য, এবং এর সামনের চ্যালেঞ্জগুলি এবং ভবিষ্যতের কম্পিউটিং ক্ষমতার চূড়ান্ত পরিস্থিতির পূর্বানুমান করবে।

লেখক, উৎস: 0x9999in1, ME News

প্রস্তাবনা

2022 এর শেষের দিকে জেনারেটিভ এআই-এর বিস্ফোরণের পর থেকে, বিশ্ব প্রযুক্তি শিল্পটি বড় মডেলকে কেন্দ্র করে একটি নতুন অস্ত্র প্রতিযোগিতায় প্রবেশ করেছে। এই প্রতিযোগিতায়, ক্যালকুলেশন ক্ষমতা হল সাফল্য বা ব্যর্থতার নির্ধারক মৌলিক অবকাঠামো। নভিডিয়া (Nvidia) তার জেনারিক গ্রাফিক্স প্রসেসিং ইউনিট (GPU) ক্ষেত্রে দীর্ঘদিনের অভিজ্ঞতা এবং CUDA সফটওয়্যার ইকোসিস্টেমের পূর্ণাঙ্গ নিয়ন্ত্রণের মাধ্যমে, AI-এর এই ঢেউয়ের সবচেয়ে বেশি লাভটি অর্জন করেছে। তবুও, 70% -এরও বেশি মার্জিনের লাভ এবং চাহিদার চেয়ে কম উৎপাদনক্ষমতার কারণে, বিশ্বব্যাপী ক্লাউড সার্ভিস প্রদানকারী (CSP) এবং AI প্রযুক্তি মহাকায়সমূহ "নভিডিয়ার জন্য কাজ করছে" এই ক্যালকুলেশনের উদ্বেগের মধ্যে পড়েছে।

এই প্রেক্ষাপটে, "ME নিউজ থিংক ট্যাঙ্ক" লক্ষ্য করেছে যে, বিশ্বের শীর্ষস্থানীয় প্রযুক্তি বড় কোম্পানিগুলি তাদের কৌশলগত ফোকাসকে মূল হার্ডওয়্যারের দিকে নিয়ে যাচ্ছে এবং একটি অতীতের কোনো সময়ে দেখা যায়নি এমন "স্ব-উন্নয়নকৃত AI চিপ" এর একটি তরঙ্গ শুরু করেছে। উত্তর আমেরিকার গুগল, অ্যামাজন, মাইক্রোসফট, মেটা থেকে শুরু করে চীনের হুয়াওয়ে, বাইডু, আলিবাবা, ডাটা-বাইট, বড় কোম্পানিগুলির চিপ তৈরি প্রথমাবস্থার "পরীক্ষা" থেকে কোম্পানির অস্তিত্বের জন্য সম্পূর্ণভাবে "কৌশলগত" হয়ে উঠেছে। এই নিবন্ধটি বিশ্বব্যাপী বড় কোম্পানিগুলির স্ব-উন্নয়নকৃত AI চিপের বিন্যাসের বর্তমান অবস্থা গভীরভাবে বিশ্লেষণ করবে, অর্থনীতি এবং মূলভিত্তির প্রযুক্তির 논িকের ভিত্তিতে যুক্তি দেখাবে যে, কেন স্ব-উন্নয়নকৃত চিপের জন্য বড় অর্থপ্রদান প্রযুক্তির বড়দের জন্যই একটি অপরিহার্য পছন্দ,এবংএটিরসম্মুখীনচ্যালেঞ্জগুলিএবংভবিষ্যতেরকমপিউটিংপটগুলিরশেষপর্যায়েরপূর্বাভাসদেবে।

বিশ্বের শীর্ষ প্রযুক্তি মহাকায় প্রতিষ্ঠানগুলির নিজস্ব এআই চিপ বিন্যাসের বর্তমান অবস্থা

বর্তমানে, বিশ্বব্যাপী বড় কোম্পানিগুলির নিজস্ব ডিজাইন করা AI চিপগুলি মূলত ক্লাউড (ডেটা কেন্দ্র) এ কেন্দ্রীভূত, যা প্রশিক্ষণ (Training) এবং উপস্থাপন (Inference) দুটি প্রধান পরিস্থিতির সাথে সম্পর্কিত। নভেডিয়ার সাধারণীকরণের পথের বিপরীতে, বড় কোম্পানিগুলি বেশিরভাগই বিশেষায়িত ইন্টিগ্রেটেড সার্কিট (ASIC) আর্কিটেকচার ব্যবহার করে, যা নির্দিষ্ট অভ্যন্তরীণ ব্যবসায়িক পরিস্থিতিতে চরম শক্তি-দক্ষতা অর্জনের জন্য কিছুটা সাধারণীকরণের বিনিময়ে।

উত্তর আমেরিকার ক্লাউড প্রোভাইডারদের ত্রিমুখী প্রতিযোগিতা এবং বিচ্ছিন্নকারী

উত্তর আমেরিকার চারটি বড় ক্লাউড প্রদানকারী (চারটি হাইপারস্কেলার) নিজস্ব চিপ ডিজাইনের ক্ষেত্রে সময়ের পার্থক্য রাখে, কিন্তু এখন তারা সম্পূর্ণভাবে প্রবেশ করেছে এবং নভিডিয়ার ক্যালকুলেশন উপর নির্ভরতার জন্য একটি “হেজ পুল” গঠন করেছে।

গুগল (Google): স্ব-উন্নয়ন পথের প্রথম এবং আদর্শ

গুগল হল বিশ্বের প্রথম বৃহৎ প্রতিষ্ঠান যে গভীর শিক্ষার মূল হার্ডওয়্যারের জন্য নতুন প্রয়োজনীয়তা চিনেছিল। ২০১৫ সালের মধ্যেই গুগল তার প্রথম জেনারেশনের টেনসর প্রসেসিং ইউনিট (TPU) স্থাপন করেছিল। প্রায় দশ বছরের বিকাশের পর, বর্তমানে TPU ছয়তম জেনারেশন (ট্রিলিয়াম) পর্যন্ত উন্নত হয়েছে।

গুগলের সুবিধা হল এর বন্ধ ইকোসিস্টেম: নীচের স্তরের TPU হার্ডওয়্যার থেকে মধ্যবর্তী স্তরের XLA কম্পাইলার এবং JAX ফ্রেমওয়ার্ক, এবং উপরের স্তরের Gemini বড় মডেল পর্যন্ত। এই এন্ড-টু-এন্ড সফটওয়্যার-হার্ডওয়্যার সমন্বয়ের কারণে, গুগল নভেডিয়া GPU ক্লাস্টারের উপর নির্ভর না করেও বিশ্বের শীর্ষস্থানীয় মাল্টিমোডাল বড় মডেলগুলি প্রশিক্ষণ দিতে সক্ষম। TPU v5p এবং Trillium-এর ইন্টারকানেকশন ব্যান্ডউইথ এবং হাই-ব্যান্ডউইথ মেমোরি (HBM)-এর উল্লেখযোগ্য উন্নতি, গুগলের অতি-বড় ক্লাস্টার (Cluster) নেটওয়ার্কিং ক্ষমতার প্রমাণ দেয়, যা নভেডিয়া NVLink-এর সঙ্গে প্রতিদ্বন্দ্বিতা করতে সক্ষম।

অ্যামাজন (AWS): খরচ এবং গ্রাহকের পছন্দের উপর ভিত্তি করে

AWS-এর চিপ তৈরির ইতিহাস 2015 সালে Annapurna Labs কে ক্রয় করার মাধ্যমে শুরু হয়। AI ক্ষেত্রে, AWS Trainium (প্রশিক্ষণের জন্য) এবং Inferentia (উপসংহারের জন্য) দুটি পণ্য লাইন বিকাশ করেছে। AWS-এর কৌশল অত্যন্ত ব্যবহারিক: এটি GPU-কে সম্পূর্ণরূপে প্রতিস্থাপনের চেষ্টা করে না, বরং AWS-এর ক্লাউড ভাড়াটিয়াদের জন্য উচ্চ-মূল্য-কার্যক্ষমতা সম্পন্ন কম্পিউটিং বিকল্প প্রদান করে। AWS-এর অফিসিয়াল ডেটা অনুযায়ী, Inferentia2 চিপ ব্যবহার করে বড় মডেলের উপসংহার চালানোর সময়, এটি অনুরূপ Amazon EC2 ইনস্ট্যান্সের তুলনায় 50% বেশি ওয়াট-প্রতি-কার্যক্ষমতা প্রদান করে।

মাইক্রোসফট (Microsoft) এবং মেটা: প্যাসিভ পেমেন্ট থেকে সক্রিয়ভাবে ব্রেকথ্রু

মাইক্রোসফট এবং মেটা আগে নভিডিয়া H100/A100-এর সর্বাধিক ক্রেতা ছিল। ওপেনএআইয়ের প্রশিক্ষণ এবং নিজস্ব কোপিলট ব্যবসাকে সমর্থন করার জন্য, মাইক্রোসফট ২০২৩-এর শেষের দিকে নিজস্ব ডিজাইন করা AI ত্বরণকারী চিপ Azure Maia 100 প্রকাশ করে। এই চিপটি টাইওয়ান সেমিকনডাক্টর ম্যানুফ্যাকচারিং কোম্পানির 5nm প্রক্রিয়ায় তৈরি, যা ক্লাউড-ভিত্তিক প্রশিক্ষণ এবং অনুমানের জন্য বিশেষভাবে ডিজাইন করা হয়েছে।

মেটার পথ তার নিজস্ব ব্যবসার সাথে অত্যন্ত সামঞ্জস্যপূর্ণ। এটি যে এমটিআইএ (মেটা ট্রেনিং এন্ড ইনফারেন্স অ্যাক্সেলারেটর) চিপটি চালু করেছে, তা প্রাথমিকভাবে ফেসবুক এবং ইনস্টাগ্রামের বিজ্ঞাপন প্রস্তাবের জন্য ডিপ লার্নিং রিকমেন্ডেশন মডেল (ডিএলআরএম) অপ্টিমাইজ করার জন্য ডিজাইন করা হয়েছিল। লামা সিরিজের ওপেন-সোর্স বড় মডেলগুলির বিস্ফোরণের পর, নতুন প্রজন্মের এমটিআইএ চিপগুলি জেনারেটিভ এআই ইনফারেন্সের জন্য উল্লেখযোগ্যভাবে সক্ষমতা বৃদ্ধি করেছে, যা শত বিলিয়ন কলের অত্যধিক ইনফারেন্স খরচ কমানোর উদ্দেশ্যে।

চীনের বড় কোম্পানিগুলির স্বদেশী প্রতিস্থাপন এবং প্রজাতন্ত্রের বিস্তার

উত্তর আমেরিকার বড় কোম্পানিগুলির খরচ কমানো এবং দক্ষতা বাড়ানোর যুক্তির বিপরীতে, চীনা টেক বড় কোম্পানিগুলি মার্কিন উচ্চ-প্রযুক্তি AI চিপের রপ্তানি নিয়ন্ত্রণের প্রেক্ষাপটে AI চিপ নিজস্বভাবে উন্নয়ন করাকে “সর্বনিম্ন প্রতিরোধ” এবং “সরবরাহ শৃঙ্খল নিরাপত্তা”-এর কৌশলগত দিক হিসেবে দেখছে।

হুয়াওয়ে: স্থানীয় ক্যালকুলেশন ক্ষমতার মূল স্তম্ভ

হুয়াওয়ে আসেন্ড সিরিজ হল বর্তমানে চীনে একমাত্র পণ্য যা অতিবৃহৎ ক্লাস্টার ট্রেনিংয়ে নভেডিয়া A100/H20-এর সাথে প্রতিস্থাপন করতে পারে। আসেন্ড 910B ডাভিনচি আর্কিটেকচার (Da Vinci) ব্যবহার করে, যা CANN (কম্পিউটেশনাল অবজেক্টিভ নেটওয়ার্ক নিউরাল আর্কিটেকচার) লেয়ার এবং মাইন্ডস্পোরসহ দেশীয় ফ্রেমওয়ার্কগুলির সাথে গভীরভাবে বাঁধা। বর্তমানে, চীনের বেশিরভাগ শীর্ষস্থানীয় বড় মডেল (যেমন: কোডা সিনফো সিংহুও, জিজি AI ইত্যাদি) আসেন্ড কম্পিউটিং ইনফ্রাস্ট্রাকচারের ভিত্তিতে অ্যাডাপটেশন এবং ট্রেনিংয়ের জন্য সম্পূর্ণরূপে বা অংশবিশেষে প্রস্তুত।

ইন্টারনেট বড় কোম্পানিগুলির ব্যবহারিক পথ: বাইডু, আলিবাবা এবং বাইটডান্স

百度的昆仑芯是国内最早落地的互联网大厂自研AI芯片之一，目前已迭代至第三代，全面支撑文心一言大模型的推理与部分微调工作。阿里平头哥半导体则推出了含光800，主要聚焦于阿里内部的电商搜索、图像识别等高并发推理场景。字节跳动作为全球拥有最庞大推荐算法算力需求的企业，虽然入局较晚，但正积极通过与台积电、博通等芯片设计和代工巨头合作，定制专用的AI ASIC芯片，以应对旗下豆包大模型及TikTok/抖音庞大的日常推理消耗。

টেবিল 1: বিশ্বের প্রধান প্রযুক্তি মহাকায় প্রতিষ্ঠানগুলির AI চিপ বিন্যাসের সারাংশ

গভীর বিশ্লেষণ: বড় কোম্পানিগুলি কেন নিজস্ব ডিজাইন করা AI চিপে বড় পরিমাণে বিনিয়োগ করতে বাধ্য?

একটি উন্নত প্রক্রিয়া (যেমন 5nm/3nm) এর এআই চিপ ডিজাইন করা খরচ হয় কয়েক কোটি ডলার, এবং এর জন্য একটি বিশাল চিপ ডিজাইন এবং সফটওয়্যার যাচাইকরণ দলকে রাখতে হয়। এই অত্যন্ত উচ্চ বাধা সত্ত্বেও, প্রযুক্তি বড়দের এগিয়ে চলছে, 'ME News থিঙ্কট্যাঙ্ক' মনে করে, এর পেছনে রয়েছে স্পষ্ট ব্যবসায়িক যুক্তি, সরবরাহ শৃঙ্খলের প্রতিদ্বন্দ্বিতা এবং মৌলিক প্রযুক্তির নিয়ম।

হাই ক্যালকুলেশন খরচ এবং ব্যবসায়িক মডেলের অস্থায়ীতা

বর্তমানে জেনারেটিভ এআইয়ের ব্যবসায়িক মডেলটি গুরুতর বিপরীত ঝুঁকির মুখোমুখি। একটি ট্রিলিয়ন প্যারামিটারের GPT-4 লেভেলের বড় মডেল প্রশিক্ষণ করতে কয়েক মাস ধরে কয়েক হাজার H100 GPU প্রয়োজন হয়, যার জন্য শুধুমাত্র হার্ডওয়্যার মূলধন ব্যয় (CapEx) কয়েকশত মিলিয়ন ডলার। এবং মডেল বাস্তবায়নের পরে, নিরন্তর অনুমান (Inference) খরচ আরও অপরিমেয়।

নভেডিয়া যেহেতু এক ট্রিলিয়ন ডলারেরও বেশি বাজেট রাখে, এটি মূলত সম্পূর্ণ AI শিল্পকে একটি উচ্চ ক্যালকুলেশন ট্যাক্স আরোপ করছে। জেনারিক GPU-এর গ্রাফিক্স রেন্ডারিং (Graphics), ডবল-প্রিসিশন ফ্লোটিং-পয়েন্ট অপারেশন (FP64) ইত্যাদি ফাংশনগুলির সমন্বয় করা প্রয়োজন, যা চিপের ট্রানজিস্টর এরিয়ার বড় অংশ দখল করে, কিন্তু শুধুমাত্র ডিপ লার্নিং-এ (যা মূলত FP16, FP8 বা INT8-এর উপর নির্ভরশীল) এগুলির কোনও ব্যবহার নেই। বড় কোম্পানিগুলি GPU কিনছে, যা বাস্তবে এই অব্যবহৃত “ডার্ক সিলিকন”-এর জন্য পেমেন্ট করছে।

বড় কোম্পানিগুলি নিজস্ব ডিজাইন করা কাস্টমাইজড ASIC চিপ ব্যবহার করে সমস্ত অপ্রয়োজনীয় ফাংশন বাদ দিতে পারে এবং প্রতিটি বর্গ মিলিমিটার সিলিকন ক্ষেত্রফলকে টেনসর ক্যালকুলেশন এবং মেমোরি ব্যান্ডউইথ অপ্টিমাইজেশনের জন্য ব্যবহার করতে পারে। শিল্পের মূল্যায়ন অনুযায়ী, নির্দিষ্ট বড় স্কেল ইনফারেন্স সিনারিওগুলিতে, নিজস্ব ASIC-এর একক ক্যালকুলেশন খরচ (TCO) সাধারণ GPU-এর 1/3 থেকে 1/5 এর মতো। Meta, ByteDance-এর মতো প্রতিদিন হাজার বিলিয়ন ইনফারেন্স কলের প্রয়োজন হওয়া কোম্পানিগুলির জন্য, যদি তাদের নিজস্ব চিপগুলি স্কেল-আপ করা হয়, তবে বছরের পর বছর অপারেশনাল খরচ (OpEx) এমনভাবে কমবে যা দশগুণেরও বেশি বিলিয়ন ডলারের। কয়েকশত মিলিয়ন ডলারের চিপ গবেষণা-উন্নয়নের প্রতিশ্রুতির বদলে, দশগুণেরও বেশি বিলিয়ন ডলারের খরচ-সঞ্চয়, এটি একটি অত্যন্ত নির্ভরযোগ্য অর্থনৈতিক হিসাব।

সাপ্লাই চেইন সুরক্ষা এবং ভূ-রাজনৈতিক ঝুঁকির হেজিং

খরচের পাশাপাশি, সরবরাহ শৃঙ্খলের দুর্বলতা প্রযুক্তি মহাকাশপথগুলির মাথার উপরে ড্যামোক্লিসের তলোয়ার। নভিডিয়ার ক্ষমতা বণ্টনে পূর্ণাঙ্গ কথোপকথন রয়েছে, এবং H100/B200 এর মতো কীভাবে গ্রাফিক্স কার্ডগুলির ডেলিভারি সময় প্রায় কয়েক মাস হতে পারে। ক্যালকুলেশন ক্ষমতা ছাড়া, বড় কোম্পানিগুলির AI ব্যবসায়িক অগ্রগতি থমকে যাবে।

স্বনির্মিত চিপ ডেভেলপ করা মূলত নিভেডিয়ার সাথে "বিক্রয় ক্ষমতা" (Bargaining Power) বাড়ানোর একটি উপায়। যদিও বড় কোম্পানিগুলি সবচেয়ে উন্নত মডেল ট্রেনিংয়ে নিভেডিয়ার থেকে সম্পূর্ণভাবে মুক্তি পেতে পারে না, তবুও ইনফারেন্স এবং রিকমেন্ডেশন সিস্টেমে স্বনির্মিত চিপ ব্যবহার করলে বাহ্যিক জেনারিক GPU-এর উপর পুরোপুরি নির্ভরশীলতা কমিয়ে আনা যায়, যার ফলে ক্রয় বিষয়ক আলোচনায় বেশি চাপ দেওয়ার সুযোগ পাওয়া যায়।

চীনা কোম্পানিগুলির জন্য, নিজস্বভাবে চিপ ডিজাইন করা একটি অপরিহার্য প্রয়োজনীয়তা। মার্কিন বাণিজ্য বিভাগের BIS রপ্তানি নিয়ন্ত্রণ নিয়মের কারণে, দেশীয় কোম্পানিগুলি সর্বোচ্চ ক্ষমতা ঘনত্ব এবং ইন্টারকানেকশন ব্যান্ডউইথ সহ বাণিজ্যিক চিপগুলি পায় না। নিজস্বভাবে ডিজাইন করে এবং দেশীয় বা মার্কিন-বহির্ভূত সেমিকনডাক্টর কন্ট্রাক্ট ম্যানুফ্যাকচারিং সিস্টেমের সাথে একীভূত হয়ে, স্বাধীন এবং নিয়ন্ত্রণযোগ্য ক্ষমতা ভিত্তি গড়ে তোলা হল দেশের AI সার্বভৌমত্ব এবং কোম্পানির ডেটা সেন্টার ব্যবসায়িক চলমানতা নিশ্চিত করার একমাত্র পথ।

সফটওয়্যার এবং হার্ডওয়্যারের সমন্বিত অপ্টিমাইজেশন এবং পার্থক্যমূলক প্রতিযোগিতামূলক বাধা

আজকের দিনে মুরের আইন ধীরে ধীরে মন্দগতি অবলম্বন করছে, এবং চিপ প্রসেসিং প্রযুক্তি (যেমন 5nm থেকে 3nm এবং তারপর 2nm) এর উপর নির্ভর করে শুধুমাত্র পারফরম্যান্স বৃদ্ধির প্রাপ্য সীমাবদ্ধতা কমে আসছে। ভবিষ্যতের কম্পিউটিং ক্ষমতার বিপ্লব, “সফটওয়্যার-ডিফাইন্ড হার্ডওয়্যার” এবং “সফটওয়্যার-হার্ডওয়্যার সহ-ডিজাইন (Hardware-Software Co-design)”-এর উপর বেশি নির্ভরশীল হচ্ছে।

জেনেরিক GPU-কে হাজার হাজার ভিন্ন অ্যাপ্লিকেশন এবং অ্যালগরিদমের সাথে সামঞ্জস্যপূর্ণ হতে হবে, তাই এর আর্কিটেকচার মধ্যপন্থী হতে হবে। অন্যদিকে, বড় কোম্পানিগুলি তাদের নিজস্ব কোর মডেলের ডেটা টাইপ, স্পারসিটি প্যাটার্ন এবং কমিউনিকেশন মডেলের উপর ভিত্তি করে স্পষ্টভাবে অপ্টিমাইজড চিপ ডিজাইন করতে পারে।

উদাহরণস্বরূপ, যদি একটি বড় কোম্পানির ব্যবসায়িক ফোকাস দীর্ঘ কনটেক্সট (Long-context) বড় ভাষা মডেল ইনফারেন্স হয়, তাহলে তাদের নিজস্ব ডিজাইন করা চিপগুলিতে পারফরম্যান্স শীর্ষ (FLOPS) অর্জনের পরিবর্তে অন্তর্নিহিত SRAM ক্ষমতা বা HBM মেমোরি ব্যান্ডউইথকে সর্বোচ্চ বাড়ানো যেতে পারে। এই ক্ষমতা, যা তাদের AI অ্যালগরিদমকে নিম্নস্তরের সিলিকন চিপে “বাড়ায়”, প্রতিদ্বন্দ্বীদের সহজেই অনুকরণ করতে অক্ষম করে তোলে, এবং একটি গভীর প্রতিরক্ষা তৈরি করে।

স্ব-উন্নয়নকৃত এআই চিপের সামনের বাস্তব চ্যালেঞ্জ এবং এর সমাধান

যদিও নিজস্ব ডিজাইন করা এআই চিপের কৌশলগত মূল্য অস্বীকার্য, তবুও এটি একটি সহজ পথ নয়। অন্ধভাবে চিপ তৈরি করলে বিপুল অর্থ বৃথা যাওয়ার সম্ভাবনা থাকে এবং নিজস্ব এআই ব্যবসার পুনরায় উন্নয়নের গতি বাধাগ্রস্ত হতে পারে।

ইকোসিস্টেমের বাধা পার হওয়া: CUDA-এর খাল কতটা গভীর?

নভেডিয়ার সবচেয়ে ভয়ঙ্কর বাধা হল হার্ডওয়্যার পারফরম্যান্স নয়, বরং এটি প্রায় বিশ বছর ধরে চালিয়ে আসছে CUDA সফটওয়্যার ইকোসিস্টেম। বর্তমানে, বিশ্বব্যাপী সর্বাধিক AI ডেভেলপার, শীর্ষস্থানীয় AI অ্যালগরিদম লাইব্রেরি (যেমন PyTorch-এর অন্তর্নিহিত অপারেটর) সবই CUDA-এর সাথে গভীরভাবে বাঁধা।

বড় কোম্পানিগুলির নিজস্ব চিপ তৈরির সবচেয়ে বড় সমস্যা হল "ভালো তৈরি করা কিন্তু ব্যবহার করা কঠিন"। যদিও চিপটি সফলভাবে প্রক্রিয়াকরণ করা হয়, তবুও যদি ডেভেলপারদের নতুন চিপের কম্পাইলারের সাথে সামঞ্জস্য করতে কয়েক মাস ধরে অধীনস্থ কোড পুনর্লিখন করতে হয়, তবে এই চিপটি অভ্যন্তরীণভাবে ব্যাপকভাবে ব্যবহার করা যাবে না।

সমস্যার সমাধানের জন্য, শিল্পটি CUDA-এর জন্য একটি ঘিরাঘিরি শুরু করেছে। একদিকে, বড় কোম্পানিগুলি নিজস্ব কম্পাইলার (যেমন গুগলের XLA) উন্নয়নে সক্রিয়ভাবে নিয়োজিত; অন্যদিকে, OpenAI-এর প্রকাশিত Triton ওপেন-সোর্স প্রোগ্রামিং ভাষাকে বড় আশা দেখানো হচ্ছে। Triton একটি CUDA-এর চেয়ে উচ্চতর সাবস্ট্রাকচারের ভাষা প্রদানের লক্ষ্যে তৈরি করা হয়েছে, যেখানে ডেভেলপাররা শুধুমাত্র একবার কোড লিখলেই Triton কম্পাইলারটি এটিকে বিভিন্ন অধস্তন হার্ডওয়্যার (যেমন Nvidia GPU, AMD GPU, এমনকি বিভিন্ন ASIC) এর জন্য মেশিন কোডে রূপান্তরিত করবে। যদি Triton বা এর মতো মধ্যবর্তী স্তরের ইকোসিস্টেমটি পরিপক্ক হয়, তবে CUDA-এর লক-ইনকে প্রায়শই দুর্বল করে ফেলা হবে, এবং বড় কোম্পানিগুলির নিজস্ব চিপগুলির জন্য স্থানান্তরের খরচ উল্লেখযোগ্যভাবে কমে যাবে।

বিশাল গবেষণা ও উন্নয়ন খরচ এবং স্কেল ইফেক্টের মধ্যে সংঘাত

চিপ শিল্প হল একটি অত্যন্ত "স্কেল ইফেক্ট" এর উপর নির্ভরশীল বিজয়ী-সব-নেয়া বাজার। নভেডিয়া তার বিশাল গবেষণা ও উন্নয়ন খরচকে বিশ্বব্যাপী লক্ষ লক্ষ GPU বিক্রির উপর বিভক্ত করতে পারে। অন্যদিকে, বড় কোম্পানিগুলির নিজস্ব ডিজাইন করা চিপগুলি সাধারণত অভ্যন্তরীণ বা নিজস্ব ক্লাউড গ্রাহকদের জন্যই ব্যবহৃত হয়, যার বিক্রয় পরিমাণ শুধুমাত্র লক্ষ বা দশ লক্ষের পরিসরে।

যদি পর্যাপ্ত স্কেল অর্জন না করা যায়, তবে স্ব-উন্নয়নকৃত চিপের প্রতিটি ইউনিটের বিভাজিত খরচ সরাসরি সাধারণ GPU ক্রয়ের তুলনায় অনেক বেশি হবে। তাই, স্ব-উন্নয়নকৃত AI চিপ অবশ্যই “কেবলমাত্র কয়েকটি বড় প্রতিষ্ঠানের জন্য একটি সাহসিক খেলা” হয়ে থাকবে। মধ্যম-দীর্ঘপ্রান্ত প্রযুক্তি প্রতিষ্ঠানগুলির জন্য, মৌলিক AI চিপ ডিজাইনের চেষ্টা না শুধুমাত্র আর্থিকভাবে অস্থায়ী, বরং টেকনোলজির আপডেটেও নভেডা ইত্যাদি পেশাদার চিপ প্রস্তুতকারকদের গতির সাথে পাল্লা দিতে পারবে না; এটির চেয়ে বেশি বুদ্ধিমানের পছন্দ হবে বিদ্যমান ক্যালকুলেশন-ক্লাউড সেবা গ্রহণ।

টেবিল 2: বাণিজ্যিক জনসাধারণের GPU এবং বড় কোম্পানির নিজস্ব ডিজাইন করা ASIC চিপের সুবিধা ও অসুবিধার তুলনা

বিশ্লেষণ: ভবিষ্যতের ক্যালকুলেশন ক্ষমতা বিন্যাসের চূড়ান্ত বিকাশ

উপরের বিশ্লেষণগুলির সমন্বয়ে, «ME News থিংকট্যাংক» পরবর্তী 3-5 বছরের বিশ্বব্যাপী AI কম্পিউটিং ক্ষমতা বিন্যাসের জন্য নিম্নলিখিত মূল্যায়ন করে:

"একটি অগ্রণী এবং অনেকগুলি শক্তিশালী" থেকে "উল্লম্ব বিভাজন"-এর দিকে: GPU প্রশিক্ষণ নিয়ন্ত্রণ করে, ASIC উপসংহার দখল করে

প্রায় দীর্ঘ সময়ের জন্য, নভিডিয়া এখনও ফ্রন্টিয়ার মডেলগুলির সীমানা অন্বেষণের জন্য অপরিহার্য রাজা হয়ে থাকবে, কারণ অত্যন্ত জটিল অতিবৃহৎ প্যারামিটার প্রশিক্ষণে অ্যালগরিদমে এখনও অত্যন্ত অনিশ্চয়তা রয়েছে, এবং এই পর্যায়ে GPU-এর সাধারণীকরণ এবং CUDA ইকোসিস্টেমের ত্রুটি-সংশোধন ও নমনীয়তা অত্যন্ত প্রয়োজন।

তবে, মডেলের পরিপক্কতার পর উপসংহার (ইনফারেন্স) পর্যায়ে এবং বৃহৎ ইন্টারনেট অ্যাপ্লিকেশন (যেমন শর্ট ভিডিও রিকমেন্ডেশন, সার্চ ইঞ্জিন রিওয়াইটিং) এর দৈনিক বাস্তবায়নে, জেনেরিক GPU-এর উচ্চ খরচ কোম্পানিগুলিকে নিজস্ব কাস্টমাইজড ASIC-এ সম্পূর্ণরূপে স্থানান্তরিত হতে বাধ্য করবে। ভবিষ্যতের ডেটা সেন্টারগুলি হাইব্রিড হবে: কয়েকটি অত্যন্ত মহঙ্গ GPU ক্লাস্টার “ড্যানস” (পরবর্তী প্রজন্মের বড় মডেল ট্রেনিং) এর জন্য, এবং লক্ষ লক্ষ নিজস্ব ডিজাইনকৃত ASIC ক্লাস্টার প্রতিদিন বিলিয়ন বিলিয়ন C-এন্ড ইউজার কলগুলির জন্য।

কাস্টম সিলিকন ক্লাউড সার্ভিসের স্ট্যান্ডার্ড হয়ে উঠেছে

যেমন আজকের বড় ডেটা সেন্টারগুলি নিজেদের সার্ভার মাদারবোর্ড এবং শীতলন ব্যবস্থা ডিজাইন করে, চিপের নিচের স্তরে কাস্টমাইজেশন করা হবে শীর্ষস্থানীয় ক্লাউড সরবরাহকারীদের (CSP) মানক সংযোজন। নিজস্ব চিপ ডিজাইনের ক্ষমতা হবে ক্লাউড সরবরাহকারীদের ক্লায়েন্টদের কাছে AI সেবা বিক্রি করার সময় মূল প্রতিযোগিতামূলক সুবিধা। নিচের হার্ডওয়্যার নিজস্বভাবে ডিজাইন করার ক্ষমতা না থাকা ক্লাউড সেবা প্রদানকারীরা ভবিষ্যতের মূল্যযুদ্ধে সম্পূর্ণভাবে মার্জিনের জায়গা হারিয়ে ফেলবে, এবং শুধুমাত্র “ডেটা সেন্টারের দ্বিতীয়ভাবে ভাড়াটিয়া”-এ পরিণত হবে।

সারাংশে, বড় কোম্পানিগুলির নিজস্ব ডিজাইন করা AI চিপগুলি নেভিডিয়াকে সম্পূর্ণভাবে "মারতে" চায় না, বরং এটি AI যুগের নীচের লাভবন্টনের অধিকার নিয়ে একটি যুদ্ধ। উপস্থাপনা এবং অভ্যন্তরীণ মূল ব্যবসায়ে ক্ষমতা স্বাধীনতা অর্জনের মাধ্যমে, প্রযুক্তি মহাকাশপথগুলি প্রযুক্তির জীবনরক্ষা এবং ব্যবসায়িক লাভের নিয়ন্ত্রণ পুনরুদ্ধার করছে। এই সফটওয়্যার-হার্ডওয়্যার সমন্বয়ের গভীর পরিবর্তনে, ক্ষমতা শুধুমাত্র কেনা যায় এমন একটি পণ্য নয়, বরং প্রতিষ্ঠানের সবচেয়ে গুরুত্বপূর্ণ কৌশলগত সম্পদ।

উৎস উদ্ধৃত:

Semianalysis. (2024). AI Inference Economics: GPUs vs Custom Silicon.
স্ট্যানফোর্ড বিশ্ববিদ্যালয় HAI. (2024). আর্টিফিশিয়াল ইন্টেলিজেন্স ইন্ডেক্স রিপোর্ট ২০২৪.
Bloomberg Technology. (2023). Microsoft এআই চিপ চালু করবে যার মাধ্যমে নভিডিয়ার উপর নির্ভরশীলতা কমানো হবে.
Patterson, D., ইত্যাদি। (2021)। কার্বন নির্গমন এবং বড় নিউরাল নেটওয়ার্ক প্রশিক্ষণ. arXiv প্রিন্ট।
AWS অফিসিয়াল ব্লগ। (2023)। Amazon EC2 Inf2 ইনস্ট্যান্স গুলি কম খরচে, উচ্চ পারফরম্যান্স জেনারেটিভ AI-এর জন্য.