चीन के एआई प्रयोगशालाओं के अंदर से नोट्स
मूल लेखक: Nathan Lambert
संकलन: Peggy, BlockBeats

संपादकीय टिप्पणी: चीनी AI प्रयोगशालाएँ वैश्विक बड़े मॉडल प्रतिस्पर्धा में एक ऐसी शक्ति बन रही हैं जिनकी उपेक्षा करना मुश्किल होता जा रहा है। उनका लाभ केवल अधिक कर्मचारियों, मजबूत इंजीनियरिंग और तेज़ अपडेट से ही नहीं है, बल्कि एक बहुत ही व्यावहारिक संगठनात्मक दृष्टिकोण से भी है: कम अवधारणाओं पर बात करें, अधिक मॉडल बनाएँ; कम व्यक्तिगत सितारों पर जोर दें, अधिक टीम के कार्यान्वयन पर; कम बाहरी सेवाओं पर निर्भर करें, और स्वयं कोर तकनीकी स्टैक पर कब्जा करने की प्रवृत्ति रखें।

नाथन लैम्बर्ट द्वारा चीन के कई शीर्ष AI प्रयोगशालाओं की यात्रा के बाद पता चला कि चीन का AI पारिस्थितिकी अमेरिका से पूरी तरह से अलग है। अमेरिका में मूल प्रणाली, पूंजी निवेश और शीर्ष वैज्ञानिकों के व्यक्तिगत प्रभाव पर अधिक ध्यान दिया जाता है; जबकि चीन पहले से मौजूद दिशाओं पर तेजी से पीछा करने में कुशल है, जहां ओपन सोर्स, इंजीनियरिंग अनुकूलन और बड़ी संख्या में युवा शोधकर्ताओं के योगदान से मॉडल क्षमताओं को जल्दी से अग्रणी स्तर पर पहुंचाया जाता है।

सबसे अधिक ध्यान देने योग्य बात यह नहीं है कि चीनी AI क्या संयुक्त राज्य अमेरिका को पार कर चुका है, बल्कि यह है कि दो अलग-अलग विकास मार्ग बन रहे हैं: संयुक्त राज्य अमेरिका अधिकतर पूंजी और सितारों वाले प्रयोगशालाओं द्वारा चलाई जा रही एक अग्रणी प्रतियोगिता की तरह है, जबकि चीन अधिकतर इंजीनियरिंग क्षमता, ओपन सोर्स पारिस्थितिकी और प्रौद्योगिकी स्व-नियंत्रण की भावना द्वारा संचालित एक उद्योग-आधारित प्रतियोगिता की तरह है।

इसका अर्थ है कि भविष्य में AI प्रतिस्पर्धा केवल मॉडल रैंकिंग की लड़ाई नहीं होगी, बल्कि संगठनात्मक क्षमता, डेवलपर इकोसिस्टम और उद्योग की कार्यान्वयन क्षमता की लड़ाई भी होगी। चीनी AI में वास्तविक परिवर्तन यह है कि यह अब केवल सिलिकॉन वैली की नकल करना बंद कर रहा है, बल्कि अपने तरीके से वैश्विक अग्रणी क्षेत्र में हिस्सा ले रहा है।

निम्नलिखित मूल पाठ है:

हांगज़ौ से शंघाई के लिए नए उच्च-गति ट्रेन पर बैठकर, मैंने खिड़की के बाहर देखा, जहां उभार वाली पहाड़ियाँ दिख रही थीं, जिन पर हवा के टरबाइन बिखरे हुए थे और सूरज के अस्त होने के समय उनकी छायाएँ बन रही थीं। पहाड़ पृष्ठभूमि बन रहे थे, जबकि सामने विशाल खेतों और ऊँची इमारतों के समूहों का मिश्रण था।

मैं बहुत विनम्रता के साथ चीन से लौटा। इतने अपरिचित स्थान पर इतनी गर्मजोशी से स्वागत किए जाने का अनुभव बहुत गर्म और मानवीय था। मैंने AI पारिस्थितिकी के कई लोगों से मुलाकात की, जिनके बारे में मैं पहले केवल दूर से जानता था; और उन्होंने मुझको चमकदार मुस्कानों और उत्साह के साथ स्वागत किया, जिससे मुझे फिर से एहसास हुआ कि मेरा काम और पूरी AI पारिस्थितिकी दोनों वैश्विक हैं।

चीनी शोधकर्ताओं का मनोदशा

चीन की कंपनियाँ जो भाषा मॉडल बना रही हैं, वे इस तकनीक के लिए 'त्वरित अनुसरणकर्ता' होने के लिए बहुत उपयुक्त हो सकती हैं। वे लंबे समय से चीन की शिक्षा और कार्य संस्कृति की परंपराओं पर आधारित हैं, और पश्चिमी देशों से थोड़ी अलग तकनीकी कंपनियों के निर्माण के तरीकों को अपनाती हैं।

यदि आप केवल उत्पादन, अर्थात् नवीनतम और सबसे बड़े मॉडल और इन मॉडलों द्वारा समर्थित एजेंट-आधारित वर्कफ्लो को देखें; और निवेश के कारकों, जैसे उत्कृष्ट वैज्ञानिकों, बड़े पैमाने पर डेटा और त्वरित कंप्यूटिंग संसाधनों को देखें, तो चीनी प्रयोगशालाएँ और अमेरिकी प्रयोगशालाएँ लगभग समान दिखती हैं। वास्तविक, दीर्घकालिक अंतर इन कारकों के कैसे संगठित और कैसे आकार दिए जाने में प्रकट होते हैं।

मैं हमेशा सोचता रहा कि चीनी प्रयोगशालाओं के आगे बढ़ने और अग्रणी स्थिति के पास बने रहने का एक कारण यह है कि उनकी संस्कृति इस कार्य के लिए बहुत अच्छी तरह से मेल खाती है। लेकिन बिना सीधे लोगों से बात किए, मुझे लगा कि मैं इस अनुभव को किसी महत्वपूर्ण प्रभाव के रूप में नहीं डाल सकता। चीन की शीर्ष प्रयोगशालाओं में कई उत्कृष्ट, विनम्र और खुले वैज्ञानिकों से बात करने के बाद, मेरी कई बातें स्पष्ट हो गईं।

आज सबसे अच्छे बड़े भाषा मॉडल का निर्माण करने के लिए, पूरी तकनीकी स्टैक में विस्तृत कार्य करना बहुत महत्वपूर्ण है: डेटा से लेकर आर्किटेक्चर विवरणों और रीइनफोर्समेंट लर्निंग एल्गोरिदम के कार्यान्वयन तक। मॉडल का प्रत्येक घटक कुछ सुधार ला सकता है, और इन सुधारों को एक साथ कैसे जोड़ा जाए, यह एक जटिल प्रक्रिया है। इस प्रक्रिया में, कुछ बहुत ही बुद्धिमान व्यक्तियों द्वारा किए गए कार्य को अक्सर एकत्रित मॉडल को बहु-लक्ष्य अनुकूलन में अधिकतम करने के लिए समय सीमा पर रखना पड़ सकता है।

अमेरिकी शोधकर्ता स्पष्ट रूप से एकल घटकों की समस्याओं को हल करने में भी बहुत कुशल हैं, लेकिन अमेरिका में एक ऐसी संस्कृति भी है जो "अपने लिए आवाज़ उठाने" को प्रोत्साहित करती है। वैज्ञानिक के रूप में, जब आप अपने कार्य के लिए ध्यान आकर्षित करने के लिए सक्रिय रूप से प्रयास करते हैं, तो आप अक्सर अधिक सफल होते हैं; और समकालीन संस्कृति एक नई प्रसिद्धि की राह बना रही है, जो कि "शीर्ष AI वैज्ञानिक" बनना है। इससे सीधा संघर्ष होगा।

बाहरी रूप से यह अफवाह है कि Llama संगठन ने इन हितों को एक श्रेणीबद्ध संगठन में शामिल करने के बाद राजनीतिक दबाव के कारण विघटित हो गया। मैंने अन्य प्रयोगशालाओं से भी सुना है कि कभी-कभी एक शीर्ष शोधकर्ता को "शांत" करना आवश्यक होता है, ताकि वे अपने विचारों को अंतिम मॉडल में शामिल नहीं किए जाने की शिकायत करना बंद कर दें। चाहे यह पूरी तरह सच हो या नहीं, इसका मतलब स्पष्ट है: स्व-चेतना और पेशेवर उन्नति की इच्छा, वास्तव में लोगों को सर्वोत्तम मॉडल बनाने से रोकती हैं। अमेरिका और चीन के बीच, यहां तक कि इस तरह का एक सांस्कृतिक छोटा दिशात्मक अंतर भी अंतिम परिणाम पर महत्वपूर्ण प्रभाव डाल सकता है।

इसमें से कुछ अंतर इस बात से संबंधित है कि चीन में ये मॉडल कौन बना रहा है। सभी प्रयोगशालाओं में एक सीधी वास्तविकता यह है: मुख्य योगदानकर्ताओं में से एक बड़ा हिस्सा अभी भी पढ़ाई कर रहे छात्र हैं। ये सभी प्रयोगशालाएँ काफी युवा हैं, जो मुझे Ai2 में हमारे संगठन के तरीके को याद दिलाती हैं: छात्रों को साथी के रूप में देखा जाता है और उन्हें प्रत्यक्ष रूप से बड़े भाषा मॉडल टीम में शामिल किया जाता है।

यह अमेरिका के शीर्ष प्रयोगशालाओं से बहुत अलग है। अमेरिका में, OpenAI, Anthropic, Cursor जैसी कंपनियाँ बिल्कुल भी इंटर्नशिप नहीं देतीं। अन्य कंपनियाँ जैसे Google, Gemini से संबंधित इंटर्नशिप का दावा करती हैं, लेकिन कई लोग डरते हैं कि उनकी इंटर्नशिप वास्तविक केंद्रीय कार्यों से अलग हो सकती है।

总的来说，这种轻微的文化差异可能通过以下方式提升模型构建能力：为了提升最终模型，人们更愿意从事那些不那么光鲜的工作；刚开始参与 AI 构建的人，可能不受此前几轮 AI 炒作周期的影响，因此能够更快适应新的现代技术方法。事实上，我交谈过的一位中国科学家明确将这一点视为优势；较低的自我意识使组织架构在一定程度上更容易扩展，因为人们较少试图“玩弄系统”；大量人才非常适合解决那些在别处已有概念验证的问题，等等。

यह वर्तमान भाषा मॉडल की क्षमता के निर्माण के लिए अधिक अनुकूल है, जो एक ज्ञात पूर्वाग्रह के विपरीत है: लोग अक्सर मानते हैं कि चीनी शोधकर्ता कम ऐसे रचनात्मक, नए क्षेत्रों को खोलने वाले '0 से 1' के शैक्षणिक शोध का उत्पादन करते हैं।

इस यात्रा के दौरान कई अधिक शैक्षणिक प्रयोगशाला भ्रमणों में, कई प्रमुखों ने बताया कि वे इस अधिक दावेदार अनुसंधान संस्कृति को विकसित कर रहे हैं। इसी समय, हमने जिन कुछ तकनीकी नेताओं से बात की है, उन्होंने संदेह व्यक्त किया है कि शैक्षणिक प्रणाली और प्रोत्साहन प्रणाली को पुनर्डिज़ाइन करने की आवश्यकता के कारण, इस वैज्ञानिक अनुसंधान के दृष्टिकोण को संक्रमित करना छोटे समय में संभव हो सकता है, क्योंकि यह परिवर्तन इतना बड़ा है कि वर्तमान आर्थिक संतुलन में इसे करना मुश्किल है।

यह संस्कृति ऐसे छात्रों और इंजीनियरों को तैयार कर रही है जो «बड़े भाषा मॉडल बनाने का खेल» करने में बहुत कुशल हैं। निश्चित रूप से, उनकी संख्या भी अत्यधिक है।

इन छात्रों ने मुझे बताया कि अमेरिका की तरह ही चीन में भी कौशल का बहिर्गमन हो रहा है: जो लोग पहले शैक्षणिक मार्ग पर जाने का विचार कर रहे थे, वे अब उद्योग के क्षेत्र में रहने की योजना बना रहे हैं। सबसे दिलचस्प बात एक ऐसे शोधकर्ता की थी, जो पहले प्रोफेसर बनना चाहता था, क्योंकि वह शिक्षा प्रणाली के करीब रहना चाहता था; लेकिन उसने बाद में टिप्पणी की कि शिक्षा को बड़े भाषा मॉडलों ने हल कर दिया है — 'छात्र मुझसे बात करने क्यों आएंगे!'

छात्र बड़े भाषा मॉडल के क्षेत्र में नए दृष्टिकोण के साथ प्रवेश करते हैं, जो एक बड़ा लाभ है। पिछले कुछ वर्षों में, हमने बड़े भाषा मॉडल के प्रमुख परिप्रेक्ष्य में लगातार परिवर्तन देखा है: MoE का विस्तार, प्रवर्धित शिक्षा का विस्तार, और एजेंट समर्थन तक। इनमें से किसी एक को सफलतापूर्वक करने के लिए, व्यापक साहित्य के साथ-साथ कंपनी के आंतरिक तकनीकी स्टैक सहित बहुत सारी पृष्ठभूमि सूचना को अत्यंत तेजी से समझने की आवश्यकता होती है।

छात्र इस तरह के काम करने के आदी होते हैं और 'क्या काम करना चाहिए' के सभी पूर्वाग्रहों को विनम्रता से छोड़ने को तैयार होते हैं। वे इसमें उतर जाते हैं, अपना जीवन इसमें लगा देते हैं, ताकि मॉडल में सुधार का अवसर प्राप्त कर सकें।

ये छात्र बहुत ही सीधे और अद्भुत रूप से थे, और वैज्ञानिकों को विचलित करने वाली कोई दार्शनिक बातचीत नहीं थी। जब मैंने उनसे मॉडल के आर्थिक प्रभाव या दीर्घकालिक सामाजिक जोखिम के बारे में उनकी राय पूछी, तो जिन चीनी शोधकर्ताओं के पास जटिल दृष्टिकोण हैं और जो इन मुद्दों पर प्रभाव डालना चाहते हैं, वे स्पष्ट रूप से कम थे। उनका मानना था कि उनकी भूमिका सबसे अच्छा मॉडल बनाना है।

यह अंतर सूक्ष्म है और आसानी से नकारा जा सकता है। लेकिन जब आप एक उचित, बुद्धिमान और अंग्रेजी में स्पष्ट रूप से व्यक्त करने में सक्षम शोधकर्ता के साथ लंबी बातचीत करते हैं, तो यह सबसे अच्छे से महसूस होता है: जब आप AI के बारे में कुछ अधिक दार्शनिक प्रश्न पूछते हैं, तो ये मूलभूत प्रश्न हवा में लटकते रहते हैं, और उनमें एक साधारण सी भ्रमितता दिखाई देती है। उनके लिए, यह एक श्रेणीगत त्रुटि है।

एक शोधकर्ता ने डैन वांग के प्रसिद्ध निर्णय का उल्लेख किया: अमेरिका वकीलों द्वारा शासित है, जबकि चीन इंजीनियरों द्वारा शासित है। इन मुद्दों पर बात करते समय, उन्होंने इस तुलना का उपयोग अपनी निर्माण की इच्छा पर जोर देने के लिए किया। चीन में, ड्वार्केश या लेक्स जैसे सुपर-मुख्यधारा पॉडकास्ट्स की तरह, चीनी वैज्ञानिकों के सितारेपन को विकसित करने का कोई प्रणालीगत मार्ग नहीं है।

मैं चीनी वैज्ञानिकों से AI के कारण भविष्य की आर्थिक अनिश्चितता, साधारण AGI क्षमताओं के आगे बढ़ने वाले मुद्दों, या मॉडल के व्यवहार के नैतिक विवादों पर टिप्पणी करने का प्रयास कर रहा हूँ; ये सभी मुद्दे मुझे अंततः इन वैज्ञानिकों के विकास के पृष्ठभूमि और शिक्षा के पृष्ठभूमि की ओर ले गए (संपादित 1)। वे अपने कार्य पर अत्यधिक केंद्रित हैं, लेकिन वे एक ऐसी प्रणाली में बड़े हुए हैं जो समाज को कैसे संगठित किया जाए और कैसे बदला जाए, इस पर चर्चा और अभिव्यक्ति को प्रोत्साहित नहीं करती है।

दूर से देखें, खासकर बीजिंग, यह मुझे बेयर एरिया जैसा लगता है: एक प्रतिस्पर्धी प्रयोगशाला, जो संभवतः कुछ कदम या टैक्सी से कुछ मिनट की दूरी पर है। मैंने अपनी उड़ान के बाद होटल जाने के रास्ते में अलीबाबा बीजिंग कैंपस का दौरा किया। अगले 36 घंटों में, हमने Zhipu AI, Moonshot AI, त्सिंहुआ विश्वविद्यालय, Meituan, Xiaomi और 01.ai का दौरा किया।

在中国使用滴滴出行非常方便。如果你选择 XL 车型，经常会分到配备按摩椅的电动小型面包车。我们向研究人员询问人才争夺战时，他们说这与我们在美国经历的非常相似。研究人员跳槽很正常，而人们选择去哪里，很大程度上取决于当前哪里的氛围最好。

在中国，大语言模型社区给人的感觉更像一个生态系统，而不是彼此交战的部落。在许多非公开对话中，我听到的几乎全是对同行的尊重。所有中国实验室都很忌惮字节跳动及其流行的豆包模型，因为它是中国唯一一家前沿闭源实验室。与此同时，所有实验室都非常尊重 DeepSeek，认为它是在执行层面最具研究品味的实验室。在美国，当你和实验室成员进行非公开交流时，火花往往很快就会四溅。

चीनी शोधकर्ताओं की विनम्रता में, मुझे सबसे अधिक प्रभावित करने वाली बात यह है कि वे व्यावसायिक स्तर पर भी अक्सर कंधे उठाते हैं और कहते हैं कि यह उनकी समस्या नहीं है। जबकि अमेरिका में, ऐसा प्रतीत होता है कि हर कोई डेटा सेलर से लेकर कैलकुलेशन पावर और फंडिंग तक, सभी पारिस्थितिक स्तरों की उद्योग प्रवृत्तियों में फंसा हुआ है।

चीन के AI उद्योग और पश्चिमी प्रयोगशालाओं के बीच भिन्नताएँ और समानताएँ

आज एक AI मॉडल बनाना इतना दिलचस्प क्यों है, क्योंकि यह अब केवल एक समूह उत्कृष्ट शोधकर्ताओं को एक ही इमारत में इकट्ठा करके एक इंजीनियरिंग चमत्कार बनाने की बात नहीं है। पहले ऐसा ही था, लेकिन AI व्यवसाय को बनाए रखने के लिए, बड़े भाषा मॉडल एक मिश्रण बन रहे हैं: इसमें निर्माण, स्थापना, वित्तपोषण, और इस रचना को स्वीकार कराने का प्रयास शामिल है।

Top AI companies exist within complex ecosystems. These ecosystems provide funding, computing power, data, and more resources to continuously push the frontiers forward.

在西方生态系统中，围绕创建和维持大型语言模型所需的各种投入要素的整合方式，已被相对充分地概念化和绘制出来。Anthropic 和 OpenAI 就是典型代表。因此，如果我们能发现中国实验室在这些问题上的思考方式存在明显差异，就能看出不同公司未来可能押注于哪些有意义的差异。当然，这些未来也会受到融资和／或算力限制的强烈影响。

मैंने इन प्रयोगशालाओं के साथ बातचीत के बाद प्राप्त कुछ प्रमुख «AI उद्योग स्तरीय» निष्कर्ष नीचे संकलित किए हैं:

पहला, घरेलू AI आवश्यकता में प्रारंभिक संकेत दिखाई दे चुके हैं।
एक व्यापक रूप से चर्चित मान्यता है कि चीनी AI बाजार छोटा होगा, क्योंकि चीनी कंपनियाँ आमतौर पर सॉफ्टवेयर के लिए भुगतान करने के लिए अनिच्छुक होती हैं, इसलिए एक ऐसा विशाल निष्कर्षण बाजार जो प्रयोगशालाओं को समर्थन दे सके, कभी नहीं खुल पाएगा।

लेकिन यह निर्णय केवल SaaS इकोसिस्टम के संगत सॉफ्टवेयर खर्च के लिए लागू होता है। और SaaS इकोसिस्टम चीन के इतिहास में हमेशा छोटा रहा है। दूसरी ओर, चीन के पास अभी भी एक विशाल क्लाउड बाजार है।

एक महत्वपूर्ण और अभी तक अनुत्तरित प्रश्न यह है कि चीनी कंपनियाँ AI पर खर्च करेंगी—क्या यह SaaS बाजार की तरह होगा, जो छोटा है; या बादल बाजार की तरह, जो मूलभूत खर्च है। यह प्रश्न चीनी प्रयोगशालाओं के भीतर भी चर्चा का विषय है। सामान्य रूप से, मुझे लगता है कि AI बादल बाजार की ओर अधिक बढ़ रहा है, और कोई भी नए उपकरणों से बनने वाले बाजार के विकास की चिंता नहीं कर रहा है।

दूसरा, अधिकांश डेवलपर्स को क्लॉड का गहरा प्रभाव पड़ा है।
हालाँकि क्लॉड को चीन में औपचारिक रूप से प्रतिबंधित किया गया है, लेकिन चीन के अधिकांश एआई विकासक क्लॉड से बहुत प्रभावित हैं, और यह कि यह उनके द्वारा सॉफ्टवेयर बनाने के तरीके को कैसे बदल दिया है। इस बात के कारण कि चीन पिछले समय में सॉफ्टवेयर खरीदने के प्रति कम रुचि रखता था, इसका मतलब यह नहीं है कि मैं चीन में निष्कर्षण की मांग में विशाल वृद्धि नहीं होगी, ऐसा मानूंगा।

चीनी तकनीकी कर्मचारी बहुत व्यावहारिक, विनम्र और प्रेरित होते हैं। यह बात मुझे किसी भी “निःशुल्क सॉफ्टवेयर खरीदने” की पारंपरिक आदत से अधिक मजबूती से प्रभावित करती है।

कुछ चीनी शोधकर्ता अपने खुद के उपकरणों का उपयोग करने का उल्लेख करते हैं, जैसे कि किमी या GLM के कमांड लाइन टूल्स, लेकिन सभी का उल्लेख क्लॉड का ही होता है। आश्चर्यजनक रूप से, कोडेक्स का बहुत कम उल्लेख होता है, जबकि क्वार्टर में कोडेक्स तेजी से लोकप्रिय हो रहा है।

तीसरा, चीनी कंपनियों में तकनीकी स्वामित्व की मानसिकता होती है।
चीनी संस्कृति एक गर्जन करते हुए चल रहे आर्थिक इंजन के साथ मिल रही है, जिससे कुछ अप्रत्याशित परिणाम उत्पन्न हो रहे हैं। मेरे द्वारा छोड़ा गया एक गहरा अनुभव यह है कि AI मॉडल्स की बड़ी संख्या, यहाँ कई प्रौद्योगिकी कंपनियों की वास्तविकता में एक व्यावहारिक संतुलन को दर्शाती है। कोई कुल योजना नहीं है।

इस उद्योग को बाइटडांस और अलीबाबा के प्रति सम्मान से परिभाषित किया गया है। वे ऐसे बड़े स्थापित खिलाड़ी माने जाते हैं जो अपने मजबूत संसाधनों के कारण कई बाजारों में जीतने की उम्मीद की जाती है। DeepSeek एक सम्मानित तकनीकी नेता है, लेकिन बाजार का नेता दूर तक नहीं है। वे दिशा निर्धारित करते हैं, लेकिन बाजार में आर्थिक रूप से जीतने की संरचना नहीं रखते हैं।

इससे मेन्गुआन या अंट ग्रुप जैसी कंपनियाँ बच जाती हैं। पश्चिमी लोग आश्चर्यचकित हो सकते हैं कि इन कंपनियों के पास इन मॉडल्स को बनाने का क्यों है। लेकिन वास्तव में, वे स्पष्ट रूप से बड़े भाषा मॉडल्स को भविष्य के तकनीकी उत्पादों का केंद्र मानते हैं, इसलिए उन्हें एक मजबूत आधार की आवश्यकता है।

जब वे एक शक्तिशाली सामान्य मॉडल को फाइन-ट्यून करते हैं, तो ओपन सोर्स समुदाय का मॉडल पर प्रतिक्रिया उनके टेक स्टैक को मजबूत बनाता है, जबकि वे अपने उत्पाद के लिए आंतरिक फाइन-ट्यून संस्करण भी बना सकते हैं। इस उद्योग में 'ओपन-फर्स्ट' मानसिकता, अधिकांशतः व्यावहारिकता द्वारा परिभाषित है: यह मॉडल को मजबूत प्रतिक्रिया प्राप्त करने में मदद करती है, ओपन सोर्स समुदाय को लाभ पहुंचाती है, और अपने स्वयं के लक्ष्य को सशक्त बनाती है।

चौथा, सरकारी समर्थन वास्तविक है, लेकिन इसका पैमाना अभी अज्ञात है।
लोग अक्सर दावा करते हैं कि चीनी सरकार सक्रिय रूप से बड़े भाषा मॉडल प्रतियोगिता को खोलने में मदद कर रही है। लेकिन यह एक बहुत स्तरों वाली, अपेक्षाकृत विकेंद्रीकृत सरकारी प्रणाली है, और प्रत्येक स्तर के पास यह निर्धारित करने के लिए कोई स्पष्ट संचालन हैंडबुक नहीं है कि उसे वास्तव में क्या करना चाहिए।

बीजिंग के विभिन्न क्षेत्रों के बीच प्रतिस्पर्धा होती है, जिसमें वे तकनीकी कंपनियों को अपने क्षेत्र में कार्यालय स्थापित करने के लिए आकर्षित करने का प्रयास करते हैं। इन कंपनियों को प्रदान किया जाने वाला “सहायता” लगभग निश्चित रूप से लाइसेंस आदि के ब्यूरोक्रेटिक प्रक्रियाओं से जुड़ी जटिलताओं को हटाने को शामिल करता है। लेकिन इस सहायता की सीमा क्या है? सरकार के विभिन्न स्तर क्या प्रतिभा को आकर्षित करने में मदद कर सकते हैं? क्या वे चिप्स की तस्करी में मदद कर सकते हैं?

इस पूरे दौरे के दौरान, सरकारी रुचि या सहायता के बारे में कई उल्लेख हुए, लेकिन संबंधित जानकारी इतनी कम है कि मैं विवरणों की घोषणा करने के लिए निष्कर्ष नहीं निकाल सकता, और न ही मैं यह आत्मविश्वास से कह सकता हूँ कि सरकार चीन में AI विकास के पथ को कैसे बदल सकती है।

इसके अलावा, चीनी सरकार के सर्वोच्च स्तर के द्वारा मॉडल के किसी भी तकनीकी निर्णय पर प्रभाव डाले जाने का कोई भी संकेत नहीं है।

पांचवां, डेटा उद्योग पश्चिमी देशों की तुलना में काफी कम विकसित है।
हमने पहले सुना था कि Anthropic या OpenAI एकल परिवेश के लिए 1000 डॉलर से अधिक खर्च करते हैं, और प्रबलन शिक्षा की सीमाओं को आगे बढ़ाने के लिए प्रति वर्ष कुल खर्च कई अरब डॉलर के स्तर पर होता है। इसलिए, हम यह जानना चाहते हैं कि क्या चीनी प्रयोगशालाएँ भी अमेरिकी कंपनियों से इन्हीं परिवेशों को खरीद रही हैं, या क्या उनका समर्थन करने के लिए एक दर्पण-जैसा आंतरिक पारिस्थितिकी तंत्र मौजूद है।

उत्तर पूर्ण अर्थ में “कोई डेटा उद्योग नहीं” नहीं है, बल्कि यह कहना है कि उनके अनुभव के अनुसार, डेटा उद्योग की गुणवत्ता अपेक्षाकृत कम है, इसलिए अक्सर बेहतर विकल्प आंतरिक रूप से वातावरण या डेटा बनाना होता है। शोधकर्ता स्वयं रीइनफोर्समेंट लर्निंग प्रशिक्षण वातावरण बनाने में बहुत समय बिताते हैं, जबकि बाइटडांस, अलीबाबा जैसी बड़ी कंपनियाँ इसके लिए आंतरिक डेटा लेबलिंग टीमें रख सकती हैं। यह सब पहले उल्लिखित “खरीदने के बजाय स्वयं बनाएँ” के मानसिकता को समर्थन देता है।

छठा, न्वाइडिया चिप्स के लिए बहुत बड़ी इच्छा है।
NVIDIA की कैलकुलेशन क्षमता ट्रेनिंग का स्वर्ण मानक है, और हर किसी की प्रगति अधिक कैलकुलेशन की कमी से सीमित है। यदि आपूर्ति पर्याप्त होती, तो स्पष्ट रूप से वे खरीदते। अन्य एक्सेलरेटर्स, जिनमें हुआवे शामिल हैं, इन्फरेंस के लिए सकारात्मक प्रतिक्रिया प्राप्त कर रहे हैं। असंख्य प्रयोगशालाएँ हुआवे चिप्स का उपयोग कर सकती हैं।

ये बिंदु एक बहुत अलग AI पारिस्थितिकी को चित्रित करते हैं। पश्चिमी प्रयोगशालाओं के संचालन को चीनी सहयोगियों पर तुरंत लागू करना अक्सर श्रेणीगत त्रुटि का कारण बनता है। मुख्य प्रश्न यह है कि क्या ये अलग-अलग पारिस्थितिकी वास्तविक अंतरों वाले मॉडल प्रकार उत्पन्न करेंगी; या क्या चीनी मॉडल हमेशा 3 से 9 महीने पहले के अमेरिकी अग्रणी मॉडल के समान व्याख्या किए जाएंगे।

निष्कर्ष: वैश्विक संतुलन

इस यात्रा से पहले, मुझे चीन के बारे में बहुत कम जानकारी थी; और जब मैं चला गया, तो मुझे लगा कि मैंने अभी तक सीखना शुरू किया है। चीन एक ऐसी जगह नहीं है जिसे नियमों या रेसिपी से व्यक्त किया जा सके, बल्कि एक ऐसी जगह है जहाँ बहुत अलग गतिविधियाँ और रासायनिक प्रतिक्रियाएँ हैं। इसका संस्कृति इतनी प्राचीन, इतनी गहरी है, और अभी भी देश के तकनीकी निर्माण के तरीके के साथ पूरी तरह से जुड़ी हुई है। मुझे अभी भी कई चीजें सीखनी हैं।

अमेरिका के वर्तमान शक्ति संरचना के कई हिस्से, अपने मौजूदा चीनी दृष्टिकोण को निर्णय लेने में एक महत्वपूर्ण मानसिक उपकरण के रूप में उपयोग करते हैं। मेरे चीन के लगभग हर शीर्ष AI प्रयोगशाला के साथ औपचारिक या अनौपचारिक व्यक्तिगत बातचीत के बाद, मुझे पता चला कि चीन में कई गुण और प्रवृत्तियाँ हैं, जिन्हें पश्चिमी निर्णय लेने की पद्धति मुश्किल से मॉडल कर सकती है।

यहां तक कि जब मैं सीधे पूछता हूं कि इन प्रयोगशालाओं ने अपने सबसे शक्तिशाली मॉडल को खुले तौर पर प्रकाशित क्यों किया, तब भी मुझे "स्वामित्व की मानसिकता" और "पारिस्थितिकी के प्रति ईमानदार समर्थन" के बीच के संबंध को पूरी तरह से जोड़ने में कठिनाई होती है।

यहाँ के प्रयोगशालाएँ बहुत व्यावहारिक हैं और ओपन सोर्स के निरपेक्षवादी नहीं हैं; उनके द्वारा बनाए गए हर मॉडल को खुले रूप से प्रकाशित नहीं किया जाता। लेकिन वे डेवलपर्स का समर्थन करने, पारिस्थितिकी का समर्थन करने, और खुलापन को अपने मॉडल को बेहतर ढंग से समझने का एक माध्यम मानने में गहरी इच्छा रखती हैं।

लगभग हर चीनी बड़ी टेक कंपनी अपना जनरल-पर्पस लार्ज लैंग्वेज मॉडल बना रही है। हमने देखा है कि मेन्गुआ जैसी प्लेटफॉर्म-आधारित सेवा कंपनियाँ और शाओमी जैसी बड़ी उपभोक्ता टेक कंपनियाँ ओपन-वेट मॉडल जारी कर चुकी हैं। अमेरिका की समकक्ष कंपनियाँ सामान्यतः केवल सेवाएँ खरीदती हैं।

ये कंपनियाँ लोकप्रिय नए चीज़ों में अपनी उपस्थिति दिखाने के लिए बड़े भाषा मॉडल नहीं बना रही हैं, बल्कि एक गहरी और मूलभूत इच्छा के कारण: अपनी तकनीकी स्टैक पर नियंत्रण रखना और आज की सबसे महत्वपूर्ण तकनीक को विकसित करना। जब मैं अपने लैपटॉप से सिर उठाता हूँ, तो हमेशा क्षितिज पर उठते हुए रेंजर्स का समूह देख पाता हूँ, जो चीन की व्यापक निर्माण संस्कृति और निर्माण ऊर्जा के साथ सुसंगठित है।

चीनी शोधकर्ताओं की मानवीयता, आकर्षण और ईमानदारी से भरी गर्मजोशी, बहुत निकटता महसूस कराती है। व्यक्तिगत स्तर पर, हम अमेरिका में जिस प्रकार की क्रूर भू-राजनीतिक चर्चा करते हैं, वह उन पर कभी नहीं टिकी। इस दुनिया में ऐसी साधारण सकारात्मकता और अधिक होनी चाहिए। AI समुदाय के एक सदस्य के रूप में, मुझे अब अधिक चिंता है कि नागरिकता के लेबल के आसपास सदस्यों और समूहों के बीच दरारें उभर रही हैं।

अगर मैं कहूं कि मुझे अमेरिकी प्रयोगशालाओं को AI टेक स्टैक के हर हिस्से में स्पष्ट नेता बनने की इच्छा नहीं है, तो मैं झूठ बोल रहा हूं। खासकर उन क्षेत्रों में जिनमें मैंने बहुत समय बिताया है, जैसे ओपन मॉडल, मैं एक अमेरिकी हूं, और यह एक ईमानदारी से पसंद है।

इसी बीच, मुझे आशा है कि खुला पारिस्थितिकी तंत्र वैश्विक स्तर पर समृद्ध होगा, क्योंकि इससे दुनिया को अधिक सुरक्षित, अधिक उपलब्ध और अधिक उपयोगी AI मिलेगी। और वर्तमान में सवाल यह है कि क्या अमेरिकी प्रयोगशालाएँ इस नेतृत्व की स्थिति को हासिल करने के लिए कदम उठाएँगी।

जब मैं इस लेख को पूरा कर रहा था, तो प्रशासनिक आदेश के प्रभाव के बारे में खुले मॉडल पर अधिक अफवाहें फैल रही थीं। इससे संयुक्त राज्य अमेरिका की नेतृत्व भूमिका और वैश्विक पारिस्थितिकी के बीच सहयोग और अधिक जटिल हो सकता है—जिससे मुझे अधिक आत्मविश्वास नहीं हुआ।

मैं मून ऑफ द डार्क साइड, ज़ही, मेन्गुआन, शाओमी, टोंगयी चियनवेन, एंटीग्रुप स्पिरिट लाइट, 01.ai और अन्य संगठनों में मेरे साथ बातचीत करने वाले सभी उत्कृष्ट लोगों का आभारी हूँ। हर कोई इतना उत्साही था और अपना समय इतना उदारतापूर्वक दे रहा था। जैसे-जैसे मेरे विचार स्पष्ट होते जाएँगे, मैं चीन के बारे में अपने अवलोकन जारी रखूँगा, जिसमें अधिक व्यापक सांस्कृतिक पहलू शामिल होंगे, साथ ही AI क्षेत्र के स्वयं के पहलू भी।

स्पष्ट रूप से, ये ज्ञान AI के अग्रणी विकास के साथ खुल रही कहानी से सीधे संबंधित होंगे।

[Original Link]

जानकारी के लिए लुटिंग ब्लॉकबीट्स में खुली नौकरियों पर क्लिक करें

लेडिंग ब्लॉकचेन न्यूज प्लेटफॉर्म लुडोंग (BlockBeats) के आधिकारिक समुदाय में शामिल हों:

टेलीग्राम सब्सक्रिप्शन समूह：https://t.me/theblockbeats

टेलीग्राम समुदाय: https://t.me/BlockBeats_App

ट्विटर आधिकारिक खाता: https://twitter.com/BlockBeatsAsia

चीनी एआई लैब्स इंजीनियरिंग और ओपन सोर्स के माध्यम से वैश्विक प्रभाव प्राप्त कर रही हैं

चीनी शोधकर्ताओं का मनोदशा

चीन के AI उद्योग और पश्चिमी प्रयोगशालाओं के बीच भिन्नताएँ और समानताएँ

निष्कर्ष: वैश्विक संतुलन