লেখক: আদা, শেনচাও টেকফ্লো
স্যান ফ্রান্সিসকো, সেন হোসে কনফারেন্স সেন্টার, GTC লাইভ।
নিউডিয়ার প্রধান বিজ্ঞানী বিল ডলি মঞ্চে বসেছেন, তার সামনে গুগলের জেফ ডিন। দুজনের কথোপকথনের মাঝামাঝি সময়ে, ডলি একটি সংখ্যা উল্লেখ করলেন: “আগে, প্রায় 2500 থেকে 3000 ইউনিট বিশিষ্ট স্ট্যান্ডার্ড সেল লাইব্রেরি স্থানান্তর করতে 8 জন ইঞ্জিনিয়ারের দলকে প্রায় 10 মাস সময় লাগত।”
সে একটু থামল।
এখন শুধুমাত্র একটি GPU কার্ড দিয়ে একটি রাত চালান।
নিচে কোনো চিৎকার হয়নি, কারণ এই বাক্যটি বুঝতে পারা সবাই জানত এর অর্থ কী। ৮ জন ইঞ্জিনিয়ারের ১০ মাসের কাজ একটি নিজস্ব তৈরি GPU দ্বারা এক রাতের মধ্যে নষ্ট হয়ে গেল। আর ডলি আরও যোগ করলেন: প্রাপ্ত ফলাফলটি ক্ষেত্রফল, শক্তি খরচ এবং ল্যাটেন্সি—এই তিনটি মাপদণ্ডে মানুষের ডিজাইনের সমান বা তারও বেশি।
পরের দিনই সংবাদ প্রকাশিত হয়েছিল যে “নভেডিয়া এআই ব্যবহার করে জিপিইউ ডিজাইন করেছে”。
কিন্তু এই ঘটনার সত্যিকারের কথা, সংবাদের শিরোনামের চেয়ে অনেক বেশি আকর্ষণীয়।
নভেডিয়ার অভ্যন্তরে কী চলছে?
নভেডিয়ার অভ্যন্তরে যা চলছে তা কোনো ব্ল্যাক বক্স নয়, বরং কয়েকটি বছর ধরে পরিশোধিত টুলচেইন।
NB-Cell একটি শক্তিশালী শিক্ষা ভিত্তিক প্রোগ্রাম যা স্ট্যান্ডার্ড সেল লাইব্রেরি মাইগ্রেশনের মতো সবচেয়ে কঠিন কাজের জন্য ডিজাইন করা হয়েছে। Prefix RL ক্যারি-লুকঅ্যাহেড চেইনের লুকঅ্যাহেড পর্যায়ের পজিশনিংয়ের দীর্ঘস্থায়ী গবেষণা সমস্যার সমাধান করতে উদ্দেশ্য। ডলি বলেছেন, এই সিস্টেমটি তৈরি করা লেআউটগুলি "মানুষ কখনও ভাবতে পারত না", এবং মানুষের ডিজাইনের তুলনায় প্রধান মেট্রিকগুলি ২০% থেকে ৩০% পর্যন্ত উন্নতি পেয়েছে।
আরেকটি হল দুটি অভ্যন্তরীণ LLM, Chip Nemo এবং Bug Nemo। নভিডিয়া এই দুটি বড় মডেলকে ঐতিহাসিকভাবে প্রতিটি GPU-এর RTL কোড, আর্কিটেকচার ডকুমেন্টেশন এবং ডিজাইন স্পেসিফিকেশন খাওয়ায়। ডলির বর্ণনা অনুযায়ী, এটি নভিডিয়ার G80 থেকে Blackwell পর্যন্ত বিশ বছরের মাসকুলার মেমোরি একটি অভ্যন্তরীণ মডেলে সংক্ষিপ্ত করার মতো, যাতে নতুনদের প্রবেশ করতেই বিশ বছরের অভিজ্ঞতা সম্পন্ন ইঞ্জিনিয়ারের সাথে সরাসরি যোগাযোগ করতে হয়।
তাহলে “AI কি GPU ডিজাইন করতে পারে”?
বর্তমানে এর বিপরীত। ডলি বলেছিলেন: “আমি একদিন সরাসরি বলতে চাই ‘আমাকে একটি নতুন GPU ডিজাইন করে দিন,’ কিন্তু আমরা এই পর্যায়ে পৌঁছাতে এখনও অনেক দূরে।”
নভেডিয়া এআই ব্যবহার করে জিপিইউ ডিজাইন করেনি। কিন্তু এটি যে অন্য একটি কাজ করেছে, তার কারণে পরবর্তীতে শিল্পটি এটি ছাড়া চলবে না।
20 বিলিয়ন ডলার ব্যয়ে EDA অভ্যন্তরীণ অঞ্চল ক্রয়
২০২৫ সালের ১ ডিসেম্বর, নভিডিয়া এডিএ এর তিনটি শীর্ষস্থানীয় কোম্পানির একটি সিনোপসিসে ২ বিলিয়ন ডলার বিনিয়োগ করে। উভয় পক্ষ একটি যৌথ উন্নয়ন চুক্তি স্বাক্ষর করে, যার মাধ্যমে নভিডিয়ার ত্বরিত গণনা স্ট্যাককে সিনোপসিসের সম্পূর্ণ এডিএ কাজের প্রবাহে এমবেড করা হয়, যাতে Blackwell এবং পরবর্তী প্রজন্মের Rubin GPU-এর সাথে Synopsys.ai-এর গভীর একীভূতকরণ ঘটে।
সিনোপসিসের অবস্থানটি ব্যাখ্যা করা দরকার। বিশ্বব্যাপী প্রতিটি উন্নত প্রক্রিয়া চিপ, যেমন অ্যাপল M সিরিজ, AMD MI সিরিজ, Google TPU, ডিজাইনের পর্যায়ে প্রায়শই সিনোপসিস বা ক্যাডেন্সের টুলচেইনে চলে। এই দুটি কোম্পানি এবং সিমেন্স EDA মিলে চিপ ডিজাইনের নীচের স্তরের টুলগুলির একচেটিয়া দখলদার। আপনি কোয়ালকমের চিপ ব্যবহার করতে পারেন না, তাইবা টাইওয়ান সেমিকনডাক্টরের লাইন ব্যবহার করতে পারেন না, কিন্তু এই তিনটির সফটওয়্যারের সাথে আপনি বাঁধা পড়বেন।
সিনোপসিসে বিনিয়োগের তিন মাস পর, নভিডিয়া ক্যাডেন্স, সিমেন্স এবং ড্যাসোল্টকেও যোগ করেছে এবং ঘোষণা করেছে যে তারা সবাই নভিডিয়া GPU-এর উপর ভিত্তি করে AI-চালিত চিপ ডিজাইন টুল তৈরি করছে।
নিভিডিয়া দ্বারা প্রকাশিত বেঞ্চমার্ক ডেটা খুব ভয়ঙ্কর: সিনোপসিস প্রাইমসিম ব্ল্যাকওয়েলে 30 গুণ দ্রুত, প্রোটিউস 20 গুণ দ্রুত, এবং সেনটানাস B200-এ CPU-এর তুলনায় 12 গুণ দ্রুত। মেডিয়াটেক H100 ব্যবহার করে ক্যাডেন্স স্পেকট্র কে 6 গুণ দ্রুত করেছে। অ্যাস্টেরা ল্যাবস সিনোপসিস + নিভিডিয়া ব্যবহার করে চিপ যাচাইকে 3.5 গুণ দ্রুত করেছে।
একটি বিশেষ বিষয় যা আলাদাভাবে উল্লেখযোগ্য: ক্যাডেন্সের মিলেনিয়াম M2000 প্ল্যাটফর্মটি "EDA বাজারের জন্য তৈরি, একচেটিয়াভাবে NVIDIA Blackwell-এর উপর ভিত্তি করে" বলে দাবি করে।
দুটি শব্দ "একচেটিয়া" সবচেয়ে বেশি মূল্যায়নযোগ্য। অর্থাৎ, আগে EDA টুলগুলি CPU-এ চলত, যেখানে Intel, AMD উভয়ই ব্যবহার করতে পারত। ভবিষ্যতে সবচেয়ে দ্রুত EDA ব্যবহার করতে হলে শুধুমাত্র NVIDIA-এর কার্ড কিনতে হবে।
ফ্লাইওয়েলের প্রকৃত আকৃতি
নভেডিয়ার ফ্লাইওয়াহলের সংস্করণটি বেশিরভাগ মানুষ এভাবে বুঝেঃ জিপিইউ বিক্রি করা এআই কোম্পানিগুলিকে, এআই কোম্পানিগুলি বড় মডেল ট্রেন করে, বড় মডেলগুলি প্রমাণ করে যে জিপিইউ অপরিহার্য, আরও বেশি মানুষ জিপিইউ কিনে।
এই ফ্লাইউইলটি ইতিমধ্যেই ভয়ঙ্কর। কিন্তু এর নিচে আরও একটি স্তর রয়েছে।
নভেডিয়া নিজের টুলস ব্যবহার করে পরবর্তী প্রজন্মের GPU ডিজাইন করেছে, যার ফলে ডিজাইন দক্ষতায় প্রজন্মগত ব্যবধান তৈরি হয়েছে এবং সম্পূর্ণ শিল্পের EDA টুলচেইনকে নিজের হার্ডওয়্যারের সাথে বেঁধে দিয়েছে। প্রতিদ্বন্দ্বীদের অনুসরণ করতে চাইলেও তাদের অনুসরণের জন্য প্রয়োজনীয় টুলগুলি নভেডিয়ার ইকোসিস্টেম থেকে ভাড়া করতে হবে।
AMD-এর শেয়ার মূল্যকে নিচু করে দেওয়া এই ফাইন্যানশিয়াল রিপোর্টের পিছনে এই উদ্বেগই লুকিয়ে আছে। যদিও নভিডিয়া এবং সিনোপসিস প্রকাশ্যে বলছে যে “বিনিয়োগের সাথে নভিডিয়া হার্ডওয়্যার ক্রয়ের কোনো বাধ্যবাধকতা নেই”, বাজার ভালোভাবেই বুঝেছে: অ্যাক্সেলারেটেড EDA ফাংশনগুলির প্রথম প্রকাশ সবসময় নভিডিয়া হার্ডওয়্যারেই হয়, এবং AMD এবং Intel-এর কাছে শুধুমাত্র “সর্বাধিক প্রতিদ্বন্দ্বীর প্ল্যাটফর্মের জন্য অপ্টিমাইজড পথ”টিই উপলব্ধ।
কল্পনা করুন, AMD-এর ইঞ্জিনিয়াররা ভবিষ্যতে ব্ল্যাকওয়েলের প্রতিদ্বন্দ্বী একটি চিপ ডিজাইন করতে চান, এবং তারা Synopsys-এর টুল খোলেন, যা নিউডেক জিপিইউ-তে সবচেয়ে দ্রুত চলে। তাহলে তাদের হয় দ্বিগুণ ধীর ডিজাইন সাইকেল সহ্য করতে হবে, নয়তো নিউডেকের চিপগুলির একটি বড় পরিমাণ কিনে নিউডেককে পরাজিত করার জন্য চিপ ডিজাইন করতে হবে।
শোভা এখনও বিক্রি হচ্ছে। কিন্তু বিক্রয় পদ্ধতি পরিবর্তিত হয়েছে।
দেশীয় GPU-এর প্রকৃত অবস্থা
এখানে একটি স্পষ্টকরণমূলক সংখ্যা দেওয়া প্রয়োজন।
একই বছর, নভেম্বর ২০২৫ আর্থিক বছরে নভিডিয়ার পরিষ্কার লাভ ৭০০ বিলিয়ন ডলারের ঊর্ধ্বে গিয়েছিল, দেশীয় GPU "চারটি ছোট ড্রাগন" মোয়ার টেকনোলজি, মুসি, বিওরেন এবং সুয়ান, IPO-এর জন্য লাইনে দাঁড়িয়েছে।
মোর টেকনোলজির আইপিও ডকুমেন্টে দেখা যায় যে, ২০২২ থেকে ২০২৪ সাল পর্যন্ত তিন বছরে মোট পরিষ্কার ক্ষতি ৫০ বিলিয়ন যুয়ান, ২০২৫ সালের প্রথম ছয় মাসে আরও ২.৭১ বিলিয়ন যুয়ান ক্ষতি হয়েছে, এবং ৩০ জুন পর্যন্ত মোট অপরিপূর্ণ ক্ষতি ১৪.৭৮ বিলিয়ন যুয়ান। কোম্পানির পরিচালনা দল নিজেরাই অনুমান করছেন যে, ২০২৭ সালের আগে একত্রিত বিবরণীতে লাভ অর্জনের সম্ভাবনা নেই। মুক্সি কিছুটা ভালো, তিন বছরের মোট ক্ষতি ৩০ বিলিয়ন যুয়ানেরও বেশি। সবচেয়ে খারাপ হলো বিলেন, তিন-আধ-বছরে ৬৩ বিলিয়ন যুয়ানেরও বেশি ক্ষতি, ২০২৫ সালের প্রথম ছয় মাসের আয় মাত্র ৫,৮৯০ মিলিয়ন যুয়ান, যা মোর টেকনোলজির ৭.০২ বিলিয়ন যুয়ানেরও কম।
আবার গবেষণা ও উন্নয়নের ব্যয়ের তীব্রতা দেখুন। মোয়ার টেকনোলজির ২০২২ সালের গবেষণা ও উন্নয়ন ব্যয় আয়ের ২৪২২.৫১% ছিল, আর ২০২৪ সালেও এটি ৩০৯.৮৮% রয়েছে। এক বছরের গবেষণা ব্যয় আয়ের তিনগুণেরও বেশি। এটি কোনও ব্যবসায়িক পরিচালনা নয়, এটি একটি ইনফিউশন যা প্রাইমারি মার্কেট এবং সাম্প্রতিকভাবে খোলা স্কেকোয়ার উইন্ডোর মাধ্যমে অবিরামভাবে রক্তপ্রদানের মাধ্যমে জীবনধারণ করছে।
টুলসের স্তরে আরও বেশি বাধা। হুয়াডা জিউটিয়ানের ২০২২ সালের আইপিও প্রস্তাবনায় দেখা যায় যে টুলসগুলি শুধুমাত্র ৫ এনএম অগ্রগতি প্রক্রিয়াকে আংশিকভাবে সমর্থন করে। গাইলুন ইলেকট্রনিক্স ৭ এনএম/৫ এনএম/৩ এনএম নোডগুলি কভার করতে পারে, কিন্তু শুধুমাত্র পয়েন্ট টুলস করে, প্রক্রিয়াটির সম্পূর্ণ প্রবাহের কথা দূরের কথা।
হুয়াদা জিউতিয়ানের প্রতিষ্ঠাতা লিউ ওয়েইপিং বলেছেন: "স্থানীয় EDA এর উন্নত প্রক্রিয়ার জন্য সমর্থন এখনও পরিষ্কারভাবে অপর্যাপ্ত, বিশেষ করে বর্তমান 7nm, 5nm, 3nm প্রক্রিয়াগুলির ক্ষেত্রে। বর্তমানে স্থানীয় EDA 14nm পর্যায়ে পৌঁছাতে পারে, যদিও 7nm প্রক্রিয়া প্রযুক্তি অর্জন করা হয়েছে, তবে 7nm-এর বাস্তব প্রয়োগের সাথে গভীরভাবে একীভূত হওয়ার জন্য সমগ্র শিল্প মূলধারার সমন্বিত প্রচেষ্টা প্রয়োজন।"
অর্থাৎ, উন্নত প্রক্রিয়ার সম্পূর্ণ প্রক্রিয়ার EDA টুলগুলি দেশীয়ভাবে প্রায় ব্যবহারযোগ্য নয়। দেশীয় GPU কোম্পানিগুলি চিপ ডিজাইনের জন্য এখনও Synopsys এবং Cadence ব্যবহার করছে। 2025 সালে ট্রাম্প একসময় সমস্ত কী সফটওয়্যারের রপ্তানি নিয়ন্ত্রণ ঘোষণা করেছিলেন, যদিও এটি বাস্তবায়িত হয়নি, তবে 7nm-এর নিচের উন্নত প্রক্রিয়ার EDA টুলগুলি এখনও কঠোরভাবে নিয়ন্ত্রিত। লাইসেন্স কখন বন্ধ হবে, সেই সুইচটি অন্যদের হাতে।
বাজারের প্রতিক্রিয়া যথেষ্ট অদ্ভুত ছিল। মু সির আইপিও দিনে, শেয়ারের বন্ধ মূল্য ৮২৯.৯ যুয়ান ছিল, একদিনে ৬৯২.৯৫% বৃদ্ধি পেয়েছিল। মো এর টেনস আইপিওর পর শেয়ারের মূল্য একসময় চীনের A-বাজারে তৃতীয় সর্বোচ্চ হয়ে উঠেছিল, শুধুমাত্র গুইজহুও মাওতাই এবং হানওয়ুজির পরে। কিছু মিডিয়া তখনকার শেয়ারের মূল্যের ভিত্তিতে গণনা করেছিল যে এর মোট বাজার মূল্য প্রায় ৩৫৯৫ বিলিয়ন যুয়ান।
সংখ্যার পিছনে বাস্তব ব্যবসা হল এমন কিছু কোম্পানি যারা এখনও পয়সা পোড়াচ্ছে, ক্ষতি করছে এবং চিপ ডিজাইন করতে নিয়ন্ত্রিত বিদেশি টুলচেইনের উপর নির্ভরশীল, কিন্তু সেগুলি দ্বিতীয় বাজারে “স্থানীয় নভিডিয়া”-এর উত্তরসূরি হিসাবে মূল্যায়ন করা হচ্ছে।
এই কোম্পানিগুলি যে টুলস ব্যবহার করে চিপ ডিজাইন করে, সেগুলি এখন নভিডিয়ার ইকোসিস্টেমের অংশ হয়ে উঠছে। নভিডিয়া এবং সিনোপসিসের 20 বিলিয়ন ডলারের বন্ধন, ক্যাডেন্স মিলেনিয়াম M2000-এর “একচেটিয়াভাবে NVIDIA Blackwell-এর উপর ভিত্তি করে” লেবেল, অনুসরণ করার প্রক্রিয়াটিকেই একটি বৈপরীত্যে পরিণত করেছে।
ডিজাইন থেকে উৎপাদন পর্যন্ত একটি সম্পূর্ণ চেইন
জিটিসি সেই আলাপচারিতায় ফিরে যান।
ডালি পুরো সময় অত্যন্ত বিনয়ী ছিল। "এআই এখনও নিজে চিপ ডিজাইন করতে পারে না"—এই কথাটি নভেডিয়া চার বছর থেকে পাঁচ বছর ধরে বলে আসছে। কিন্তু প্রতি বছর এর বক্তব্য পরিবর্তিত হচ্ছে। চার বছর আগে ছিল "এআই ডিজাইনে সহায়তা করতে পারে", তিন বছর আগে ছিল "এআই কিছু ধাপকে স্বয়ংক্রিয় করতে পারে", আজকের বক্তব্য—"একটি রাতে ৮জনের ১০ মাসের কাজ শেষ করা।" প্রতি বছর একটি পদক্ষেপ, প্রতি বছর "চূড়ান্ত লক্ষ্যের দূরত্ব এখনও অনেক" বলে একটি বাক্য। তিন বছর পরে ফিরে তাকালে, আগের "অনেক"টি ইতিমধ্যেই সম্পন্ন, এবং "অনেক"টির নতুন সংজ্ঞা সবচেয়ে বড় প্রতিদ্বন্দ্বীদেরও অপ্রাপ্য স্থানে।
গত বারো মাসে নভেডিয়া শুধুমাত্র একটি কাজ করেছে: এআইকে চিপ শিল্প শৃঙ্খলের সবচেয়ে মূল্যবান এবং সবচেয়ে গভীর প্রতিরক্ষা ব্যবস্থাযুক্ত কয়েকটি ধাপে ব্যবহার করেছে, এবং এই টুলগুলি ধাপে ধাপে সম্পূর্ণ শিল্পের মধ্যে বিক্রি করেছে।
চিপ ডিজাইনের ফ্রন্ট-এন্ড চিপ নেমো এই অভ্যন্তরীণ LLM দ্বারা নিয়ন্ত্রিত হচ্ছে; ডিজাইনের মধ্যভাগের স্ট্যান্ডার্ড সেল লাইব্রেরি মাইগ্রেশন এবং লেআউট অপ্টিমাইজেশন এনবি-সেল এবং প্রিফিক্স আরএল দ্বারা নিয়ন্ত্রিত হচ্ছে; সমগ্র EDA টুলচেইন সিনোপসিসের 20 বিলিয়ন ডলার এবং ক্যাডেন্সের “একচেটিয়া ব্ল্যাকওয়েল-ভিত্তিক” সংযোগের মাধ্যমে নিজস্ব GPU-এর সাথে বাঁধা পড়েছে; উৎপাদনের প্রক্রিয়ায় লিথোগ্রাফির গণনা cuLitho দ্বারা নিয়ন্ত্রিত হচ্ছে, TSMC এটি ইতিমধ্যে ব্যবহার করছে।
ডিজাইন থেকে উৎপাদন পর্যন্ত, প্রতিটি ধাপে নভিডিয়া এআই ব্যবহার করে পুনর্নির্মাণ করেছে। প্রতিটি ধাপের শেষেই একই লক্ষ্যে পৌঁছায়: আপনি যদি সবচেয়ে দ্রুত টুল চান, তবে নভিডিয়ার কার্ড কিনুন।
Blackwell কে পরাজিত করতে চাওয়া সমস্ত চিপ ডিজাইনারদের জন্য সবচেয়ে বিব্রতকর বিষয়টি ঘটে গেছে। এই চিপটি ডিজাইন করতে প্রয়োজনীয় EDA টুলসের সবচেয়ে দ্রুত সংস্করণটি নভেডিয়ার GPU-এ চলে; এই চিপটি তৈরি করতে প্রয়োজনীয় লিথোগ্রাফি গণনার সবচেয়ে দ্রুত অ্যালগরিদম লাইব্রেরি নভেডিয়া দ্বারা প্রদান করা হয়; এবং ডিজাইন AI-এর জন্য প্রশিক্ষণের প্রয়োজনীয় কম্পিউটিং পাওয়ারও নভেডিয়ার GPU-এ।
যে ব্যক্তিকে তুমি পরাজিত করতে চাও, সে তোমাকে এটি পরাজিত করার জন্য প্রয়োজনীয় সমস্ত সরঞ্জাম ভাড়া দিচ্ছে। ভাড়া বার্ষিক পরিশোধ করা হয়, এবং চুক্তি প্রতি বছর বেড়ে যায়।
