জীববিজ্ঞান ডেটার মেশিন ইন্টারফেস নেই, যা প্রক্রিয়াকরণ স্তর দ্বারা AI-এর সঠিকতা উল্লেখযোগ্যভাবে বৃদ্ধি করা যায়।লেখক এবং উৎস: নিউ জ্ঞান মেটা
【পরিচিতি】 শীর্ষস্থানীয় এআই কোডিং দ্রুত উন্নতি করছে, কিন্তু জীববিজ্ঞানের ক্ষেত্রে এটি বারবার ব্যর্থ হচ্ছে—এটি মডেলটি যথেষ্ট বুদ্ধিমান নয় বলে নয়, বরং বিজ্ঞানের ডেটাবেস এখনও মানুষের মাউস ক্লিকের জন্যই তৈরি হয়েছে।
সবচেয়ে শক্তিশালী মডেলটি সবচেয়ে কমই প্রত্যাশিত জায়গায় পড়ে গেল: গোনার বিষয়ে?
সাম্প্রতিক সময়ে, Anthropic একটি বিজ্ঞান ব্লগ প্রকাশ করেছে যার শিরোনাম “Paving the way for agents in biology”, যেখানে কিছু সংখ্যা দেখে পিঠ শীতল হয়ে যায়।

https://www.anthropic.com/research/agents-in-biology
গবেষকরা বর্তমানের সবচেয়ে শক্তিশালী কয়েকটি বৈজ্ঞানিক বুদ্ধিমত্তা (Claude, GPT, Biomni, Edison Analysis) কে একটি অত্যন্ত সহজ কাজ করতে বলেছেন: NCBI Virus ডাটাবেস থেকে নির্দিষ্ট শর্ত পূরণকারী ভাইরাল ক্রমগুলির সংখ্যা সঠিকভাবে গণনা করা।
ফলাফল হলো, কোনোটিই স্থিরভাবে সঠিক উত্তর দিতে পারেনি।
আরও অবিশ্বাস্য বিষয় হলো, একই প্রশ্ন, একই মডেল, একই প্রম্পট দিয়ে তিনবার জিজ্ঞাসা করলে উত্তর পাঁচালিশ গুণ পর্যন্ত ভিন্ন হতে পারে।
ক্লড সনেট 4 এবোলা ভাইরাস সিকোয়েন্স জিজ্ঞাসা করে, প্রথমে 106টি, দ্বিতীয়বার 15টি, তৃতীয়বার 5টি ফলাফল প্রদান করে। কিন্তু সঠিক উত্তর হল 266টি।কি এআই জীববিজ্ঞান করতে পারে না?
এর পিছনে লুকিয়ে আছে একটি বেদনাদায়ক সত্য: বিজ্ঞানের ক্ষেত্রে, এজেন্টের প্রকৃত দুর্বলতা যুক্তি নয়, বরং এটি কোনও স্থিতিশীল, পুনরাবৃত্তযোগ্য, মেশিন-বান্ধব পথই অনুপস্থিত, যা ডেটা সঠিকভাবে বের করতে পারে।
বিশেষ অনুসন্ধান স্তর ছাড়া, বিভিন্ন সিস্টেমের গড় সঠিকতা 16.9% থেকে 91.3% পর্যন্ত বিস্তৃত, যদিও নতুন মডেলগুলিতে উন্নতি হয়েছে, তবুও অবশিষ্ট ভুলগুলি মারাত্মক: কারণ এই ধরনের কাজের পাসিং লাইন বাস্তবে 100%।
একটি রেকর্ড কম থাকলে একটি ডায়াগনস্টিক রিজেন্ট সমস্ত প্রচলিত ভাইরাস স্ট্রেনকে কভার করছে বলে মনে হতে পারে, অথবা একটি মহামারীর শুরু কয়েক সপ্তাহ ভুলভাবে অনুমান করা হতে পারে।
তাহলে, সমস্যাটি ঠিক কোথায়?
ঘোড়াগাড়ির জন্য তৈরি শহর, গাড়ি চলে না
অ্যানথ্রোপিক একটি অত্যন্ত স্পষ্ট উপমা দিয়েছে: বায়োলজিক্যাল ডেটাবেস চালানোর জন্য এজেন্ট ব্যবহার করা হলো যেন গাড়ি আবিষ্কার হওয়ার আগে তৈরি একটি পুরনো শহরের মধ্যে গাড়ি চালানো।
রাস্তাগুলি সম্ভবত সুন্দর এবং সুসজ্জিত, কিন্তু সবই ঘোড়াগাড়ির জন্য ডিজাইন করা সরু পথ এবং তীক্ষ্ণ বাঁক। বিচ্ছিন্ন ডেটাবেস, বিবিধ ফাইল ফরম্যাট, একবারের জন্য রিট্রিভাল স্ক্রিপ্ট—এগুলি এই পুরনো শহরের অংশ। আপনি এতে কিছু ট্রাফিক সাইন যোগ করতে পারেন, কয়েকটি পার্কিং স্পেস তৈরি করতে পারেন, কয়েকটি রাস্তা প্রসারিত করতে পারেন, কিন্তু মূল শহরের কাঠামোটি শুরু থেকেই গাড়ির জন্য তৈরি হয়নি।
সফটওয়্যারের দুনিয়া ঠিক উল্টো। এটি গাড়ির জন্য তৈরি একটি নতুন শহর: সমতল বিটুমেন রাস্তা, স্পষ্ট লেন, স্ট্যান্ডার্ডাইজড সিগন্যাল। ভার্সন কন্ট্রোল, ভালভাবে ডকুমেন্টেড API, প্যাকেজ ম্যানেজার—একটি সম্পূর্ণ সিস্টেম যা আপনাকে শুরু থেকে শেষ পর্যন্ত দ্রুত পৌঁছে দেয়, যা প্রাথমিকভাবেই 'গাড়ি' (অর্থাৎ, এজেন্ট) এর জন্য তৈরি।
তাই কোড বুদ্ধিমত্তা দ্রুত এগিয়ে যাচ্ছে, কিন্তু জৈবিক বুদ্ধিমত্তা একই জায়গায় ঘুরছে।
সফটওয়্যার ক্ষেত্রে স্ট্রাকচারড ডিজিটাল ওয়ার্কফ্লো এবং নির্ভরযোগ্য ইন্টারফেস দেওয়া হয়, একটি GitHub ইসু, প্যাচ জেনারেট করা, টেস্ট চালানো, এবং সরাসরি ভেরিফাই করা। বায়োলজি ক্ষেত্রে দেওয়া হয় ভঙ্গুর, হেটারোজিনিয়াস, এবং প্রক্রিয়া-নির্ভর ইনফ্রাস্ট্রাকচার, যার প্রায় কোনো সহজ, ভেরিফাইয়েবল এবং অর্থপূর্ণ রিওয়ার্ড সিগন্যাল নেই।
NCBI Virus-এর ক্ষেত্রে, এটি আরও স্পষ্টভাবে বলা যায় যে এটি একটি ওয়েব পোর্টাল। আপনি ওয়েবপৃষ্ঠায় শর্তগুলি চিহ্নিত করেন: হোস্ট মানুষ, নমুনা সংগ্রহের স্থান আফ্রিকা, সিকোয়েন্স দৈর্ঘ্য কোনো নির্দিষ্ট মানের বেশি, ল্যাব-প্রজনিত নমুনা বাদ দিন, তখনই ওয়েবসাইটের ব্যাকএন্ড এই শর্তগুলিকে নিম্নস্তরের বহু ডাটাবেস (GenBank, RefSeq, INSDC সিস্টেম) -এর জন্য কুয়েরির মধ্যে অনুবাদ করে, এবং তারপর ফলাফলগুলি আপনার জন্য ছাঁটাই করে।

NCBI ভাইরাস পোর্টালের হোমপেজ: ভাইরাস সিকোয়েন্স অনুসন্ধান করতে প্রথমে ওয়েবপেজে বিকল্প নির্বাচন করতে হবে, কীওয়ার্ড টাইপ করতে হবে, ফিল্টার ক্লিক করতে হবে—এই সম্পূর্ণ ইন্টারঅ্যাকশন মানুষের জন্য ডিজাইন করা, যা মেশিনের জন্য সরাসরি পুনঃব্যবহারযোগ্য নয়।
এর বড় পরিমাণ ফিল্টারিং লজিক ওয়েবপেজ লেয়ারে লেখা হয়েছে, এটি একটি পরিষ্কার প্রোগ্রাম ইন্টারফেস হিসাবে বাইরের জন্য উন্মুক্ত করা হয়নি।
মানুষের ভাইরাসবিদদের জন্য, এটি শুধু ব্রাউজারে কয়েকটি ক্লিকের বিষয়। মেশিন (এজেন্ট) এর জন্য, এটি সত্যিই দুর্ভোগ। কারণ এজেন্টগুলি সরাসরি ব্যবহার করতে পারে শুধুমাত্র নিম্নস্তরের কয়েকটি প্রাথমিক API (REST, Datasets, E-utilities), এবং এই APIগুলি ওয়েবপৃষ্ঠার সমান ফিল্টারিং অর্থপূর্ণতা প্রকাশ করে না।
একটি নির্দিষ্ট উদাহরণ দিন:
ওয়েবপেজে "নমুনা স্থান আফ্রিকায়" একটি চেকবক্স, যার পিছনে দশগুণ দেশের মেটাডেটা ফিল্ডগুলি সিঙ্ক্রোনাইজ করতে হবে এবং সেই ফিল্ডগুলির লেখার পদ্ধতি অসমঝার রেকর্ডগুলি প্রক্রিয়া করতে হবে; "পৃষ্ঠের গ্লাইকোপ্রোটিন সহ" এই শর্তটি কেবলমাত্র অনুক্রমের ভিত্তিতে চিহ্নিত করা যায় না, প্রতিটি রেকর্ডের জিন/প্রোটিন অ্যানোটেশন GenBank থেকে টানে এবং তুলনা করতে হবে।
এই গোপন ধাপগুলি ওয়েবসাইট আপনার জন্য করে দেয়, কিন্তু মূল API করে না।
তাই এজেন্টটিকে নিজে নিজে এই লজিকটি আবার জোড়া দিতে হয়। কিছু বাদ পড়লে কম গণনা হয় (একটি আফ্রিকান দেশের সিকোয়েন্স বাদ পড়ে যায়), ভুল করলে বেশি গণনা হয় (ফিল্টারিং শর্তগুলি ভুলভাবে বুঝা হয়)।
এটাই সনেট 4-এর একই বিষয়ে তিনটি উত্তর 106, 15, 5-এর মূল কারণ: এটি প্রতিবার ভিন্ন ভিন্ন ফিল্টারিং লজিক পুনর্গঠন করে।
gget virus যা সমাধান করছে, তা হলো: ওয়েব ইন্টারফেসের মধ্যে লুকানো ফিল্টারিং আচরণটিকে একটি স্থিতিশীল, পুনরুৎপাদনযোগ্য এবং মেশিন সরাসরি কল করার যোগ্য প্রোগ্রামেটিক সিস্টেমে পুনর্নির্মাণ করা, যাতে বুদ্ধিমান এজেন্টকে প্রতিবার আবার অনুমান করতে হয় না।
একটি সিক�োয়েন্স ভুল করে ফেলা হয়েছে, প্রাদুর্ভাবের শুরু কয়েক সপ্তাহ সরে গেছে
যদি আপনি মনে করেন যে "কয়েকটি সিকোয়েন্স ভুল গণনা করা" কোনও সমস্যার কথা নয়, তাহলে নিচের লাইভ শো আপনার মতামত পরিবর্তন করে দেবে।
2026 সালের মে মাসে, কঙ্গো গণতান্ত্রিক প্রজাতন্ত্রে বান্ডিবুজু ইবোলা মহামারী শুরু হয়। 14 মে, ইএনআরবি, কিনশাসা 13টি রক্ত নমুনা বিশ্লেষণ করে এবং পরবর্তী দিন সেগুলির মধ্যে 8টি প্রমাণিত হয়। 29 মে এর মধ্যে, বিশ্ব স্বাস্থ্য সংগঠন প্রতিবেদন করে যে নিশ্চিত এবং সন্দেহভাজন মামলার সংখ্যা 1000-এর বেশি এবং 200-এরও বেশি মৃত্যু হয়েছে।
গবেষকদের সামনে তিনটি জীবন-মৃত্যুর প্রশ্ন রয়েছে: এই ভাইরাসটি আগেরগুলির চেয়ে কতটা ভিন্ন? বর্তমান নির্ণয় এটি শনাক্ত করতে পারে কি? বর্তমান চিকিৎসা এখনও কার্যকর কি?
এই প্রশ্নগুলির উত্তর দিতে, আপনাকে নতুন জিনোম এবং NCBI Virus-এর ইতিহাসগত ইবোলা জিনোমগুলির সাথে একে একে তুলনা করতে হবে। এবং এই বিশ্লেষণের প্রথম ধাপটি হল ওয়েবসাইটে হাতে ক্লিক করা, একটি দীর্ঘ জটিল ফিল্টারিং শর্তগুলি হাতে পুনরায় প্রয়োগ করা, এবং প্রাপ্ত ডেটাসেটটি সম্পূর্ণ এবং সঠিক হবে কিনা তা নিয়ে আশা করা।
গবেষকরা আগের ইবোলা অনুসন্ধানটি ব্যবহার করে সনেট 4 কে ডেটা টানতে, একটি পরিবার গঠন করতে এবং "সর্বশেষ সাধারণ পূর্বপুরুষের সময় (TMRCA)" অনুমান করতে বলেছিলেন। এটি একটি মহামারীর উৎপত্তির সময় নির্ণয়ের জন্য একটি কী পরিমাপ।
মানব পরিশোধিত ডেটাসেটে 2014 সালের জানুয়ারিতে TMRCA দেওয়া হয়েছে, যা পূর্ববর্তী প্রতিবেদনগুলির সাথে সঙ্গতিপূর্ণ।
সনেট 4 দ্বারা উত্পাদিত তিনটি ডেটা সেটের মধ্যে দুটি স্পষ্টভাবে অসম্পূর্ণ। একটি সেট প্রাথমিক সময়কালকে 2014 থেকে 1922 বছরে ফিরিয়ে আনে, যা কোনো ভিত্তি ছাড়াই নব্বইয়েরও বেশি বছর যোগ করে। অপর একটি সেট যদিও যথাযথভাবে দেখায়, তবে গিনির সিরিজটি বাদ দেয় এবং প্রাথমিক সময়কালকে চুপচাপ 2014 এপ্রিলে সরিয়ে দেয়, ফলে সময়রেখাটি পরিবর্তিত হয়ে যায়।

জেইর ইবোলা প্রজাতিগত গাছ: উপরের বামে ম্যানুয়ালি সংশোধিত ডেটা, রান 1 থেকে 3 হল Sonnet 4 অনুসন্ধানের ফলাফল। লাল বিচ্ছিন্ন রেখা TMRCA চিহ্নিত করে, ধূসর রঙ হারিয়ে যাওয়া বা ভুল দেশের তথ্য নির্দেশ করে।
এবোলা অ্যান্টিবডি থেরাপি মাফটিভিম্যাব এবং এমবিপি১৩৪-এর লক্ষ্য স্থানগুলির ইতিহাসে কি কোনো প্রচলিত পরিবর্তন ঘটেছে, তা পর্যবেক্ষণ করে গবেষকরা বুঝতে চাইছেন যে এই থেরাপিগুলি ভাইরাসের উন্নতির সাথে কি পাশাপাশি চলতে পারছে। ফলাফল হলো, সনেট ৪ তিনটি সম্পূর্ণ ভিন্ন পরিবর্তনের চিত্র দেখিয়েছে।

জেইরে ইবোলা গ্লাইকোপ্রোটিন পরিবর্তনের বণ্টন, লাল রং যত গাঢ় হবে তত বেশি কমন, গোলকগুলি হল ম্যাফটিভিম্যাব, এমবিপি১৩৪ অ্যান্টিবডি বন্ধন স্থান। সবচেয়ে বামে কৃত্রিমভাবে সংশোধিত ডেটা, সনেট ৪-এর তিনটি অনুসন্ধান (রান ১ থেকে ৩) ফলাফল ভিন্ন।
ব্যর্থতার প্যাটার্নটি স্পষ্ট: ফলাফলের সেট বড় করার সময় মধ্যে থেকে থামলে সংখ্যা হারিয়ে যায়; ভুল ফিল্টারিং শর্ত ব্যবহার করলে সংখ্যা বেড়ে যায়। ইনফ্লুয়েঞ্জা A, HIV-1 ইত্যাদি রেকর্ডে ভাইরাসের পরিমাণ অসংখ্য, যা সবচেয়ে বেশি বিষয়বস্তুর বিকৃতি ঘটায়। ফিল্টারিং শর্তগুলি একসাথে তিন-চারটির বেশি হলে, পারফরম্যান্স সরাসরি ধ্বংস হয়ে যায়।
ভুল করেও যে ঠিক বলে দাঁড়ায়, বিজ্ঞানের মধ্যে সবচেয়ে ভয়ঙ্কর ধরনের ভুল।
পুরানো শহরের জন্য একটি মেশিন-বান্ধব টানেল খনন করুন
তাহলে, কিভাবে ঠিক করবেন?
অ্যানথ্রোপিক এবং এনসিবিআই-এর গবেষকরা একটি গেগেট ভাইরাস তৈরি করেছেন।
এটি আরেকটি ফ্ল্যাশি "AI প্লাগইন" নয়, বরং একটি নির্ধারণমূলক রিট্রিভাল স্তর। মূলত, এটি NCBI Virus ওয়েব ইন্টারফেসের ফিল্টারিং আচরণকে পুনরুৎপাদনযোগ্য প্রোগ্রামেটিক সিস্টেমে অনুবাদ করে।
প্রযুক্তিগতভাবে, এটি REST, Datasets, E-utilities কয়েকটি নিম্নস্তরের সিস্টেমকে একীভূত করে, যা স্বয়ংক্রিয়ভাবে নির্ধারণ করে কোন ফিল্টারগুলি API এর মাধ্যমে চলবে এবং কোনগুলি স্থানীয়ভাবে যাচাই করা প্রয়োজন। এটি ব্যাচ ডেটা প্রাপ্তি পরিচালনা করে, যাতে বড় ফলাফল সেটগুলি সম্পূর্ণভাবে ডাউনলোড করা যায়, মধ্যে মধ্যে কাটা না যায়।
এটি INSDC সিস্টেম (NCBI, ENA, DDBJ) থেকে ভাইরাল নিউক্লিওটাইড ক্রম এবং সংযুক্ত মেটাডেটা ডাউনলোড করে, এবং FASTA, CSV, JSONL এর মতো মানুষ এবং মেশিন উভয়েরই বোধগম্য ফরম্যাটে আউটপুট দেয়, যার সাথে বিস্তারিত লগ থাকে যা আপনাকে বলে যে এই ফলাফলটি কীভাবে গণনা করা হয়েছে। প্রচুর প্রশ্নের জন্য, এটি ডেটা ট্রান্সফারকে 98% এরও বেশি কমিয়েছে।
প্রভাব তাৎক্ষণিক।
gget ভাইরাস সংযোগের পর, সমস্ত পরীক্ষিত সিস্টেমের সঠিকতা 90.0% এর উপরে চলে গেল, GPT-5.5 বেড়ে 99.7% এ পৌঁছাল। চলমান প্রক্রিয়াগুলির মধ্যে দৈবিক দোলন প্রায় অদৃশ্য হয়ে গেল, স্থিতিশীলতা 0.92 থেকে 1.00 এ বেড়েছে।
সবচেয়ে ভালো বিষয় হলো, মডেলগুলির মধ্যের পার্থক্যও ব্যাপকভাবে কমিয়ে দেওয়া হয়েছে।

VirBench বেঞ্চমার্কে বিভিন্ন এজেন্টের রিট্রিভাল সঠিকতা: gget virus (গাঢ়) যুক্ত করার পর সবগুলো 90% ছাড়িয়ে গেছে, সবচেয়ে ডানদিকে gget virus একা চলছে।
নিশ্চিত টুল লেয়ার যোগ করার পরে, আপনি কোন মডেল ব্যবহার করছেন তা তেমন গুরুত্বপূর্ণ নয়।
এটাই সত্যিকার অর্থে মনোযোগ দেওয়ার মতো জিনিস।
একটি নির্ভরযোগ্য ডেটাসেট তৈরি করা কখনও আপনার সর্বশেষ এবং সবচেয়ে মহঙ্গা মডেল কিনতে পারবেন কিনা বা আপনি কোন মডেলটি কোন ডাটাবেসের সাথে সবচেয়ে ভালোভাবে মানানসই তা ঠিকমতো জানেন কিনা তার উপর নির্ভর করবে না। সঠিক টুলসের সাথে সস্তা মডেলও স্থিতিশীলভাবে কাজ করতে পারে।
একটি আকর্ষণীয় বিস্তারিত আছে। 360টি রানের মধ্যে, GPT-5.5 কোনো প্রম্পট ছাড়াই নিজে থেকে gget virus খুঁজে পেয়েছিল এবং এটি ব্যবহার করেছিল। এবং সেই একমাত্র সময়টিতেই সে সেই প্রশ্নের উত্তর সঠিকভাবে দিয়েছিল।
টুলের মূল্য, মডেলটি নিজেই পায়ে ভোট দিয়েছে।
সত্যিকারের জয়ের হাতিয়ার, মডেল থেকে ভিত্তির দিকে সরে যাওয়া
এটি শুধু ভাইরাস সম্পর্কে নয়, এটি আরও বেশি কিছু।
প্রতিটি «মানুষের জন্য, বুদ্ধিমত্তার জন্য নয়» পরিবেশে একই ঘর্ষণ দেখা যায়।
কয়েক মাস আগে কারপাথি এআই যুগের সফটওয়্যার নিয়ে কথা বলেন, নিজের ভাইব কোডিংয়ের কথা উল্লেখ করেন—একটি ছোট ওয়েব অ্যাপ তৈরি করেছিলেন, কিন্তু এটি লাইভ করতে (লগইন, পেমেন্ট, ডিপ্লয়) এক সপ্তাহ ধরে শুধুমাত্র ব্রাউজারে ক্লিক করতে গিয়েছিলেন। তাঁর সিদ্ধান্ত ছিল: “কোডিং করা সবচেয়ে সহজ অংশ।”

কারপাথির স্পিচ স্লাইড: "Docs for people" — Vercel, Clerk ইত্যাদি সার্ভিসের কনফিগারেশন ডকুমেন্টেশন সম্পূর্ণরূপে মানুষের জন্য ডিজাইন করা হয়েছে, "এখানে ক্লিক করুন, সেখানে পূরণ করুন" — LLM সরাসরি কল করতে পারে না।
কারপাথির অভিযোগ শুনে জীববিজ্ঞানীরা হয়তো খুব বেশি সহমর্মিতা অনুভব করবেন: এই যন্ত্রণা, তারা অনেক বছর ধরে সহ্য করে আসছেন।
gget virus শুধুমাত্র একটি অপব্যবহার নয়; এই ধরনের "কনটেক্সট ইঞ্জিন" তৈরি করছে ToolUniverse, Robin, Biomni এবং অন্যান্য বায়োমেডিকেল এজেন্টগুলি।
সমস্যাটি হল: নির্ধারণবাদকে কোন স্তরে রাখা উচিত এবং এটি কীভাবে তৈরি করা উচিত।
অবশ্যই, কেউ প্রশ্ন করবে: মডেলের প্রগতি এত দ্রুত, যদি কোনোদিন এজেন্টগুলি এতটাই শক্তিশালী হয়ে উঠে যায় যে তারা নিজেরাই বিশৃঙ্খলা পোর্টালের মধ্যে দিয়ে যেতে পারবে, ID-কে সামঞ্জস্য করতে পারবে, সঠিকভাবে পৃষ্ঠা উল্টাতে পারবে, এবং ভুলগুলি নিজেই ঠিক করতে পারবে, তাহলে gget virus এর মতো 'স্ক্যাফোল্ডিং'গুলি কি হঠাৎই শূন্যে চলে যাবে?
সম্ভব। কিন্তু Anthropic-এর উত্তর হল: যদিও এজেন্টগুলি এটি করতে পারে, তবুও প্রতিবার এটি আবার আবিষ্কার করার দরকার নেই।
এই বিশৃঙ্খলা ডেটা সংগ্রহ প্রক্রিয়াটি নিজে পার করতে পারে এমন মডেলটি সম্ভবত খুব ব্যয়বহুল, খুব ধীর, খুব কঠিন অডিট করা যায়, খুব বিশ্বাস করা যায় না, এবং দৈনিক গবেষণার জন্য সমর্থন করতে পারে না।
আরও বলা যায়, যদিও স্ক্যাফোল্ডিং চূড়ান্তভাবে পুরনো হয়ে যাবে, বায়োলজিক্যাল ডেটাবেসের জন্য শিক্ষা এখনও বৈধ: এখন থেকেই এজেন্টগুলিকে স্কেলড ব্যবহারকারী হিসাবে বিবেচনা করুন এবং প্রথম থেকেই বড় পরিসরের কলের জন্য তৈরি করুন।
এই প্রতিযোগিতার পৃষ্ঠতলে, কে বেশি বুদ্ধিমান মডেল তৈরি করেছে তা নির্ধারিত হয়। একটি স্তর নিচে, কার ভিত্তি মেশিনের জন্য বেশি উপযুক্ত তা পরীক্ষা করা হয়।
আমাদের মডেলটিকে অনুমান তৈরি করতে এবং পরীক্ষা ডিজাইন করতে অসীম কল্পনা ব্যবহার করতে হবে। কিন্তু এর নিচের স্তরটি: জিনেটিক আইডেন্টিফায়ার, ডেটা স্কিমা, রিট্রিভাল লজিক, কোঅর্ডিনেট সিস্টেম, মেটাডেটা চুক্তি—এগুলোকে পুরোপুরি নির্ভরযোগ্যভাবে 'বিরক্তিকর' হতে হবে।
মডেল কার্ভ এখনও উপরের দিকে যাচ্ছে।
কিন্তু এই রাউন্ডের প্রকৃত বিজয়ী হয়তো মেঘের বড় মডেলে নয়, বরং নীচের সেই ডেটা ইনফ্রাস্ট্রাকচারে, যার কোনো কেউ মেরামত করতে চায় না, কিন্তু যা সাফল্য বা ব্যর্থতা নির্ধারণ করে।
