संपादकीय टिप्पणी: चीनी AI प्रयोगशालाएँ वैश्विक बड़े मॉडल प्रतिस्पर्धा में एक ऐसी शक्ति बन रही हैं जिनकी उपेक्षा करना मुश्किल होता जा रहा है। उनका लाभ केवल अधिक प्रतिभा, मजबूत इंजीनियरिंग और तेज़ अपडेट से ही नहीं है, बल्कि एक बहुत व्यावहारिक संगठनात्मक दृष्टिकोण से भी है: कम अवधारणाओं पर बात करें, अधिक मॉडल बनाएँ; कम व्यक्तिगत सितारों पर जोर दें, अधिक टीम के कार्यान्वयन पर; कम बाहरी सेवाओं पर निर्भर करें, और स्वयं कोर तकनीकी स्टैक पर कब्जा करने की प्रवृत्ति रखें।
लेखक नाथन लैम्बर्ट ने चीन के कई शीर्ष AI प्रयोगशालाओं की यात्रा के बाद पाया कि चीन का AI पारिस्थितिकी संस्थान अमेरिका के समान नहीं है। अमेरिका अनोखे पैटर्न, पूंजी निवेश और शीर्ष वैज्ञानिकों के व्यक्तिगत प्रभाव पर अधिक ध्यान केंद्रित करता है; जबकि चीन पहले से मौजूद दिशाओं पर तेजी से पीछा करने में कुशल है, जिसमें खुला स्रोत, इंजीनियरिंग अनुकूलन और बड़ी संख्या में युवा शोधकर्ताओं के योगदान के माध्यम से मॉडल क्षमताओं को जल्दी से अग्रणी स्तर तक पहुंचाया जाता है।
सबसे अधिक ध्यान देने योग्य बात यह नहीं है कि चीनी AI क्या संयुक्त राज्य अमेरिका को पार कर चुका है, बल्कि यह है कि दो अलग-अलग विकास मार्ग बन रहे हैं: संयुक्त राज्य अमेरिका अधिक रूप से पूंजी और सितारों के प्रयोगशालाओं द्वारा चलाई जा रही एक अग्रणी प्रतियोगिता की तरह है, जबकि चीन अधिक रूप से इंजीनियरिंग क्षमता, ओपन सोर्स पारिस्थितिकी और प्रौद्योगिकी स्वायत्तता की भावना द्वारा संचालित एक उद्योग-आधारित प्रतियोगिता की तरह है।
इसका अर्थ है कि भविष्य में AI प्रतिस्पर्धा केवल मॉडल रैंकिंग की लड़ाई नहीं होगी, बल्कि संगठनात्मक क्षमता, डेवलपर इकोसिस्टम और उद्योग की कार्यान्वयन क्षमता की लड़ाई भी होगी। चीनी AI में वास्तविक परिवर्तन यह है कि यह अब केवल सिलिकॉन वैली की नकल करना बंद कर रहा है, बल्कि अपने तरीके से वैश्विक अग्रणी क्षेत्र में हिस्सा ले रहा है।
नीचे मूल पाठ है:
हंगचोउ से शंघाई के लिए नए प्रकार की हाई-स्पीड ट्रेन में बैठकर, मैंने खिड़की से बाहर देखा, जहाँ उठान-गिरावट वाली पहाड़ियाँ दिख रही थीं, जिन पर विंड टरबाइन्स बिखरी हुई थीं और सूरज के अस्त होने के समय उनकी छायाएँ बन रही थीं। पहाड़ पृष्ठभूमि बन रहे थे, और सामने विशाल खेतों और ऊँची इमारतों के समूहों का मिश्रण दिख रहा था।
मैं बहुत विनम्रता के साथ चीन से लौटा। इतने अपरिचित स्थान पर इतनी गर्मजोशी से स्वागत किए जाने का अनुभव बहुत गर्म और मानवीय था। मैंने AI पारिस्थितिकी के कई लोगों से मुलाकात की, जिनके बारे में मैं पहले केवल दूर से जानता था; और उन्होंने मुझको चमकदार मुस्कानों और उत्साह के साथ स्वागत किया, जिससे मुझे फिर से एहसास हुआ कि मेरा काम और पूरी AI पारिस्थितिकी दोनों वैश्विक हैं।
चीनी शोधकर्ताओं का मनोभाव
चीन की कंपनियाँ, जो भाषा मॉडल बना रही हैं, इस तकनीक के लिए 'त्वरित अनुसरणकर्ता' होने के लिए बहुत उपयुक्त हो सकती हैं। वे लंबे समय से चीन की शिक्षा और कार्य संस्कृति पर आधारित हैं, और पश्चिमी देशों से थोड़ी अलग तकनीकी कंपनियों के निर्माण के तरीके भी अपनाती हैं।
यदि आप केवल आउटपुट—अर्थात् नवीनतम और सबसे बड़े मॉडल और इन मॉडलों द्वारा समर्थित एजेंट-आधारित वर्कफ्लो—को देखें, और इनपुट तत्व—जैसे उत्कृष्ट वैज्ञानिक, बड़े पैमाने पर डेटा और त्वरित कंप्यूटिंग संसाधन—को देखें, तो चीनी और अमेरिकी प्रयोगशालाएँ लगभग समान दिखती हैं। वास्तविक, दीर्घकालिक अंतर इन तत्वों के संगठन और आकार देने के तरीके में प्रकट होते हैं।
मैं हमेशा सोचता रहा कि चीनी प्रयोगशालाओं के आगे बढ़ने और अग्रणी स्थिति के पास बने रहने का एक कारण यह है कि उनकी संस्कृति इस कार्य के लिए बहुत अच्छी तरह से मेल खाती है। लेकिन बिना सीधे लोगों से बात किए, मुझे लगा कि मैं इस अनुभव को किसी महत्वपूर्ण प्रभाव के रूप में नहीं बता सकता। चीन की शीर्ष प्रयोगशालाओं में कई उत्कृष्ट, विनम्र और खुले वैज्ञानिकों से बात करने के बाद, मेरी कई बातें स्पष्ट हो गईं।
आज सबसे अच्छा बड़ा भाषा मॉडल बनाने के लिए, पूरी तकनीकी स्टैक में सूक्ष्म कार्य करना बहुत महत्वपूर्ण है: डेटा से लेकर आर्किटेक्चर विवरणों और रीइनफोर्समेंट लर्निंग एल्गोरिदम के कार्यान्वयन तक। मॉडल का प्रत्येक घटक कुछ सुधार ला सकता है, और इन सुधारों को एक साथ कैसे जोड़ा जाए, यह एक जटिल प्रक्रिया है। इस प्रक्रिया में, कुछ बहुत ही बुद्धिमान व्यक्तियों द्वारा किए गए कार्य को अक्सर एक बहु-लक्ष्य अनुकूलन में समग्र मॉडल को अधिकतम करने के लिए समय पर छोड़ना पड़ सकता है।
अमेरिकी शोधकर्ता स्पष्ट रूप से एकल घटकों की समस्याओं को हल करने में भी बहुत कुशल हैं, लेकिन अमेरिका में एक 'अपने लिए आवाज़ उठाने' की संस्कृति भी है। वैज्ञानिक के रूप में, जब आप अपने कार्य के लिए ध्यान आकर्षित करने के लिए सक्रिय रूप से प्रयास करते हैं, तो आप अक्सर अधिक सफल होते हैं; और समकालीन संस्कृति एक नई प्रसिद्धि की राह बना रही है, जो 'शीर्ष AI वैज्ञानिक' बनना है। इससे सीधा संघर्ष होगा।
बाहरी रूप से यह अफवाह है कि Llama संगठन ने इन हितों को संगठनात्मक स्तरों में शामिल करने के बाद राजनीतिक दबाव के कारण विघटित हो गया। मैंने अन्य प्रयोगशालाओं से भी सुना है कि कभी-कभी एक शीर्ष शोधकर्ता को 'शांत' करना आवश्यक होता है, ताकि वे अपने विचारों को अंतिम मॉडल में शामिल नहीं किए जाने की शिकायत करना बंद कर दें। चाहे यह पूरी तरह सच हो या नहीं, इसका मतलब स्पष्ट है: स्व-चेतना और पेशेवर उन्नति की इच्छा, वास्तव में लोगों को सर्वोत्तम मॉडल बनाने में बाधा डालती है। अमेरिका और चीन के बीच, यहां तक कि इस प्रकार का सांस्कृतिक सूक्ष्म दिशात्मक अंतर भी अंतिम परिणाम पर महत्वपूर्ण प्रभाव डाल सकता है।
इस अंतर का एक हिस्सा यह है कि चीन में ये मॉडल कौन बना रहा है। सभी प्रयोगशालाओं में एक सीधी वास्तविकता यह है कि मुख्य योगदानकर्ताओं में से एक बड़ा हिस्सा अभी भी पढ़ाई कर रहे छात्र हैं। ये सभी प्रयोगशालाएँ काफी युवा हैं, जो मुझे Ai2 में हमारे संगठन के तरीके को याद दिलाती हैं: छात्रों को साथी के रूप में देखा जाता है और उन्हें प्रत्यक्ष रूप से बड़े भाषा मॉडल टीम में शामिल किया जाता है।
यह अमेरिका के शीर्ष प्रयोगशालाओं से बहुत अलग है। अमेरिका में, OpenAI, Anthropic, Cursor जैसी कंपनियाँ बिल्कुल भी इंटर्नशिप नहीं देतीं। अन्य कंपनियाँ जैसे Google, Gemini से संबंधित इंटर्नशिप का दावा करती हैं, लेकिन कई लोग डरते हैं कि उनकी इंटर्नशिप वास्तविक केंद्रीय कार्यों से अलग हो सकती है।
सामान्य तौर पर, इस हल्की सांस्कृतिक भिन्नता के कारण मॉडल बनाने की क्षमता में सुधार हो सकता है: अंतिम मॉडल को बेहतर बनाने के लिए लोग उन कम चमकदार कार्यों को करने के लिए अधिक तैयार होते हैं; AI बनाने में शुरुआत करने वाले लोग पिछले AI बुलबुले के चक्रों से प्रभावित नहीं होते, इसलिए वे नए आधुनिक तकनीकी तरीकों को तेजी से अपना लेते हैं। वास्तव में, मैंने जिस चीनी वैज्ञानिक से बात की, उन्होंने इसे स्पष्ट रूप से एक लाभ के रूप में देखा; कम स्वयं-चेतना के कारण संगठनात्मक संरचना को कुछ हद तक आसानी से स्केल किया जा सकता है, क्योंकि लोग कम प्रयास करते हैं कि 'सिस्टम को धोखा दें'; बहुत सारे प्रतिभाशाली लोग ऐसी समस्याओं को हल करने के लिए बहुत उपयुक्त हैं, जिनके लिए अन्यत्र पहले ही प्रोटोटाइप सफलतापूर्वक सिद्ध हो चुके हैं, आदि।
यह वर्तमान भाषा मॉडल की क्षमता के निर्माण के लिए अधिक अनुकूल है, जो एक ज्ञात प्रतिबिंब के विपरीत है: लोग अक्सर मानते हैं कि चीनी शोधकर्ता कम ऐसे रचनात्मक, नए क्षेत्रों को खोलने वाले '0 से 1' के शैक्षणिक शोध का उत्पादन करते हैं।
इस यात्रा के दौरान कई अधिक शैक्षणिक प्रयोगशाला भ्रमणों में, कई प्रमुखों ने बताया कि वे इस अधिक दावेदार अनुसंधान संस्कृति को विकसित कर रहे हैं। इसी बीच, हमने जिन कुछ तकनीकी नेताओं से बात की, उन्होंने संदेह व्यक्त किया कि शैक्षणिक प्रणाली और प्रोत्साहन प्रणाली को पुनर्डिज़ाइन करने की आवश्यकता के कारण, इस वैज्ञानिक अनुसंधान दृष्टिकोण का पुनर्गठन छोटे समय में संभव हो सकता है, क्योंकि यह परिवर्तन बहुत बड़ा है और वर्तमान आर्थिक संतुलन में होना मुश्किल है।
यह संस्कृति ऐसे छात्रों और इंजीनियरों को तैयार कर रही है जो 'बड़े भाषा मॉडल बनाने का खेल' में बहुत कुशल हैं। निश्चित रूप से, उनकी संख्या भी अत्यधिक अधिक है।
इन छात्रों ने मुझे बताया कि अमेरिका की तरह ही चीन में भी कौशल का बहिर्गमन हो रहा है: जिन लोगों ने पहले शैक्षणिक मार्ग पर जाने की सोची थी, वे अब उद्योग के क्षेत्र में रहने की योजना बना रहे हैं। सबसे दिलचस्प बात एक ऐसे शोधकर्ता की थी, जो पहले प्रोफेसर बनना चाहता था, क्योंकि वह शिक्षा प्रणाली के करीब रहना चाहता था; लेकिन उसने बाद में टिप्पणी की कि शिक्षा को बड़े भाषा मॉडलों ने हल कर दिया है—“छात्र मुझसे बात करने क्यों आएंगे!”
छात्र बड़े भाषा मॉडल के क्षेत्र में नए दृष्टिकोण के साथ प्रवेश करते हैं, जो एक बड़ा लाभ है। पिछले कुछ वर्षों में, हमने बड़े भाषा मॉडल के मुख्य परिप्रेक्ष्य में लगातार परिवर्तन देखा है: MoE का विस्तार, रीइनफोर्समेंट लर्निंग का विस्तार, और एजेंट समर्थन तक। इनमें से किसी एक को सफलतापूर्वक करने के लिए, व्यापक साहित्य के साथ-साथ कंपनी के आंतरिक तकनीकी स्टैक सहित बहुत सारी पृष्ठभूमि सूचना को अत्यंत तेजी से समझने की आवश्यकता होती है।
छात्र इस तरह के काम करने के आदी होते हैं और 'क्या काम करना चाहिए' के सभी पूर्वधारणाओं को विनम्रता से छोड़ने को तैयार होते हैं। वे इसमें गहराई से उतर जाते हैं, अपना जीवन समर्पित करते हैं, ताकि मॉडल में सुधार का अवसर प्राप्त कर सकें।
ये छात्र बहुत ही सीधे और अद्भुत रूप से थे, और वे उन दार्शनिक चर्चाओं से बचते थे जो वैज्ञानिकों को विचलित कर सकती थीं। जब मैंने उनसे मॉडल के आर्थिक प्रभाव या दीर्घकालिक सामाजिक जोखिम के बारे में उनकी राय पूछी, तो जिन चीनी शोधकर्ताओं के पास जटिल दृष्टिकोण होते हैं और जो इन मुद्दों पर प्रभाव डालना चाहते हैं, वे स्पष्ट रूप से कम थे। उनका मानना था कि उनकी भूमिका केवल सर्वोत्तम मॉडल बनाना है।
यह अंतर सूक्ष्म है और आसानी से नकारा जा सकता है। लेकिन जब आप एक उचित, बुद्धिमान और अंग्रेजी में स्पष्ट रूप से व्यक्त करने में सक्षम शोधकर्ता के साथ लंबी बातचीत करते हैं, तो यह सबसे अच्छे से महसूस होता है: जब आप AI के बारे में कुछ अधिक दार्शनिक प्रश्न पूछते हैं, तो ये मूलभूत प्रश्न हवा में लटकते रहते हैं, और उनकी चेहरे पर सादगी से भ्रम का भाव दिखाई देता है। उनके लिए, यह एक श्रेणीगत त्रुटि है।
एक शोधकर्ता ने डैन वांग के प्रसिद्ध निर्णय का उल्लेख किया: अमेरिका वकीलों द्वारा शासित है, जबकि चीन इंजीनियरों द्वारा शासित है। इन मुद्दों पर चर्चा करते समय, उन्होंने इस तुलना का उपयोग अपनी निर्माण की इच्छा पर जोर देने के लिए किया। चीन में, ड्वार्केश या लेक्स जैसे सुपर-मेनस्ट्रीम पॉडकास्ट्स की तरह, चीनी वैज्ञानिकों के सितारे की पहचान को विकसित करने का कोई प्रणालिगत मार्ग नहीं है।
मैं चीनी वैज्ञानिकों से AI के कारण भविष्य की आर्थिक अनिश्चितता, साधारण AGI क्षमता से आगे बढ़ने वाले मुद्दों, या मॉडल के व्यवहार के नैतिक विवादों पर टिप्पणी करने का प्रयास कर रहा था; ये सभी प्रश्न मुझे अंततः इन वैज्ञानिकों के विकास के पृष्ठभूमि और शिक्षा के पृष्ठभूमि की ओर ले गए (संपादित 1)। वे अपने कार्य पर अत्यधिक केंद्रित हैं, लेकिन वे एक ऐसी प्रणाली में बड़े हुए हैं जो समाज को कैसे संगठित किया जाए और कैसे बदला जाए, इस पर चर्चा और अभिव्यक्ति को प्रोत्साहित नहीं करती है।
दूर से देखें, खासकर बीजिंग, यह मुझे बेयर एरिया जैसा लगता है: एक प्रतिस्पर्धी प्रयोगशाला, जो संभवतः कुछ कदम या टैक्सी से कुछ मिनट की दूरी पर है। मैंने अपने उड़ान के बाद होटल जाने के रास्ते में अलीबाबा बीजिंग कैंपस का दौरा किया। अगले 36 घंटों में, हमने Zhipu AI, Moonshot AI, त्सिंहुआ विश्वविद्यालय, Meituan, Xiaomi और 01.ai का दौरा किया।
चीन में डीडी एक्सिंग का उपयोग करना बहुत सुविधाजनक है। यदि आप XL वाहन विकल्प चुनते हैं, तो आपको अक्सर मसाज सीट वाली बिजली से चलने वाली छोटी बैंगनी वैन मिलती है। हमने शोधकर्ताओं से प्रतिस्पर्धा के बारे में पूछा, और उन्होंने कहा कि यह अमेरिका में हमारे अनुभव के बहुत समान है। शोधकर्ताओं का स्थान बदलना सामान्य है, और लोग यह तय करते हैं कि वे कहाँ जाएँ, जिस पर अधिकांशतः वर्तमान में कहाँ का माहौल सबसे अच्छा है, निर्भर करता है।
चीन में, बड़े भाषा मॉडल समुदाय एक पारस्परिक जीवन व्यवस्था की तरह महसूस होता है, न कि एक-दूसरे के साथ लड़ते हुए जनजातियों की तरह। कई गैर-सार्वजनिक बातचीत में, मैंने लगभग सभी सहयोगियों के प्रति सम्मान की बात सुनी है। सभी चीनी प्रयोगशालाएँ बाइटडांस और इसके लोकप्रिय डोबाओ मॉडल को बहुत सावधानी से देखती हैं, क्योंकि यह चीन की एकमात्र अग्रणी बंद स्रोत प्रयोगशाला है। इसके बीच, सभी प्रयोगशालाएँ DeepSeek को बहुत सम्मान करती हैं, क्योंकि इसे कार्यान्वयन स्तर पर सबसे अधिक शोध-स्वाद वाली प्रयोगशाला माना जाता है। अमेरिका में, जब आप प्रयोगशाला सदस्यों के साथ गैर-सार्वजनिक बातचीत करते हैं, तो आग की चिंगारियाँ जल्दी ही उड़ने लगती हैं।
चीनी शोधकर्ताओं की विनम्रता में, मुझे सबसे अधिक यह बात प्रभावित करती है कि वे व्यावसायिक स्तर पर अक्सर कंधे उठाकर कहते हैं कि यह उनकी समस्या नहीं है। जबकि अमेरिका में, ऐसा लगता है कि हर कोई डेटा सेलर से लेकर कैलकुलेशन क्षमता और फंडिंग तक, सभी पारिस्थितिक स्तर की उद्योग प्रवृत्तियों में फंसा हुआ है।
चीन के AI उद्योग और पश्चिमी प्रयोगशालाओं के बीच भिन्नताएँ और समानताएँ
आज एक AI मॉडल बनाना इतना दिलचस्प है क्योंकि यह अब केवल एक साथ एक बिल्डिंग में कुछ उत्कृष्ट शोधकर्ताओं को इकट्ठा करके एक इंजीनियरिंग चमत्कार बनाने की बात नहीं है। पहले ऐसा ही था, लेकिन AI बिजनेस को बनाए रखने के लिए, बड़े भाषा मॉडल एक मिश्रण बन रहे हैं: इसमें निर्माण, स्थापना, वित्तपोषण, और इस आविष्कार को अपनाया जाना शामिल है।
शीर्ष AI कंपनियाँ जटिल पारिस्थितिकी तंत्र में मौजूद होती हैं। ये पारिस्थितिकी तंत्र लगातार अग्रिम को आगे बढ़ाने के लिए वित्त, कंप्यूटिंग पावर, डेटा और अधिक संसाधन प्रदान करते हैं।
पश्चिमी पारिस्थितिकी तंत्र में, बड़े भाषा मॉडल बनाने और उन्हें बनाए रखने के लिए आवश्यक विभिन्न इनपुट तत्वों के एकीकरण के तरीके को अपेक्षाकृत पूरी तरह से संकल्पित और चित्रित किया जा चुका है। Anthropic और OpenAI इसके प्रमुख उदाहरण हैं। इसलिए, यदि हम यह पाते हैं कि चीनी प्रयोगशालाएँ इन मुद्दों पर अलग तरीके से सोचती हैं, तो हम यह समझ सकते हैं कि विभिन्न कंपनियाँ भविष्य में किन महत्वपूर्ण अंतरों पर निवेश कर सकती हैं। निश्चित रूप से, ये भविष्य वित्तपोषण और/या कैलकुलेशन क्षमता के प्रतिबंधों से भी मजबूती से प्रभावित होंगे।
मैंने इन प्रयोगशालाओं के साथ बातचीत के बाद प्राप्त कुछ प्रमुख «AI उद्योग स्तरीय» निष्कर्ष नीचे संकलित किए हैं:
पहला, घरेलू AI आवश्यकता में प्रारंभिक संकेत दिखाई दे चुके हैं।
एक व्यापक रूप से चर्चित मान्यता है कि चीनी AI बाजार छोटा होगा, क्योंकि चीनी कंपनियाँ आमतौर पर सॉफ्टवेयर के लिए भुगतान करने के लिए अनिच्छुक होती हैं, इसलिए एक ऐसा विशाल निष्कर्षण बाजार जो प्रयोगशालाओं को समर्थन दे सके, कभी भी मुक्त नहीं हो पाएगा।
लेकिन यह निर्णय केवल SaaS इकोसिस्टम के संगत सॉफ्टवेयर खर्च के लिए लागू होता है। और SaaS इकोसिस्टम चीन के इतिहास में हमेशा छोटा रहा है। दूसरी ओर, चीन में अभी भी एक विशाल क्लाउड बाजार है।
एक महत्वपूर्ण और अभी तक अनुत्तरित प्रश्न यह है कि चीनी कंपनियाँ AI पर खर्च करेंगी—क्या यह SaaS बाजार की तरह होगा, जो छोटा है; या बादल बाजार की तरह होगा, जो मूलभूत खर्च है। यह प्रश्न चीनी प्रयोगशालाओं के भीतर भी चर्चा का विषय है। सामान्य रूप से, मुझे लगता है कि AI बादल बाजार की ओर अधिक बढ़ रहा है, और कोई भी नए उपकरणों से बनने वाले बाजार के विकास की चिंता नहीं कर रहा है।
दूसरा, अधिकांश डेवलपर्स को क्लॉड का गहरा प्रभाव पड़ा है।
हालाँकि क्लॉड को चीन में औपचारिक रूप से प्रतिबंधित किया गया है, लेकिन चीन के अधिकांश एआई विकासक क्लॉड से बहुत प्रभावित हैं और यह कैसे उनके सॉफ्टवेयर बनाने के तरीके को बदल रहा है। यह केवल इसलिए कि चीन पिछले समय में सॉफ्टवेयर खरीदने के प्रति कम रुचि रखता था, इसका मतलब यह नहीं है कि मैं चीन में निष्कर्षण की मांग में भारी वृद्धि नहीं होगी, ऐसा मानूंगा।
चीनी तकनीकी कर्मचारी बहुत व्यावहारिक, विनम्र और प्रेरित होते हैं। यह बात मुझे किसी भी 'निःशुल्क सॉफ्टवेयर खरीदने' की पारंपरिक आदत से अधिक मजबूती से प्रभावित करती है।
कुछ चीनी शोधकर्ता अपने स्वयं के उपकरणों, जैसे कि किमी या GLM के कमांड लाइन टूल्स का उपयोग करने का उल्लेख करते हैं, लेकिन सभी क्लॉड का उपयोग करने का उल्लेख करते हैं। आश्चर्यजनक रूप से, कोडेक्स का उल्लेख बहुत कम किया जाता है, जबकि कोडेक्स बे एरिया में स्पष्ट रूप से तेजी से लोकप्रिय हो रहा है।
तीसरा, चीनी कंपनियों में तकनीकी स्वामित्व की मानसिकता होती है।
चीनी संस्कृति एक गर्जन करते हुए चल रहे आर्थिक इंजन के साथ मिल रही है, जिससे कुछ अप्रत्याशित परिणाम उत्पन्न हो रहे हैं। मेरे द्वारा छोड़ा गया एक गहरा अनुभव यह है कि AI मॉडल्स की बड़ी संख्या, यहाँ कई प्रौद्योगिकी कंपनियों की वास्तविकता में एक व्यावहारिक संतुलन को दर्शाती है। कोई कुल योजना नहीं है।
इस उद्योग को बाइटडांस और अलीबाबा के प्रति सम्मान से परिभाषित किया गया है। वे ऐसे बड़े स्थापित खिलाड़ी माने जाते हैं जो अपने मजबूत संसाधनों के कारण कई बाजारों में जीत हासिल करेंगे। डीपसीक एक सम्मानित तकनीकी नेता है, लेकिन बाजार का नेता दूर तक नहीं है। वे दिशा निर्धारित करते हैं, लेकिन बाजार में आर्थिक रूप से जीतने की संरचना नहीं रखते हैं।
इससे मेन्गुआन या एंट ग्रुप जैसी कंपनियाँ बच जाती हैं। पश्चिमी लोग आश्चर्यचकित हो सकते हैं कि इन कंपनियों के पास भी ये मॉडल बनाने का क्यों है। लेकिन वास्तव में, वे स्पष्ट रूप से बड़े भाषा मॉडल को भविष्य के तकनीकी उत्पादों का केंद्र मानते हैं, इसलिए उन्हें एक मजबूत आधार की आवश्यकता है।
जब वे एक शक्तिशाली सामान्य मॉडल को फाइन-ट्यून करते हैं, तो ओपन सोर्स समुदाय का मॉडल पर प्रतिक्रिया उनके टेक स्टैक को मजबूत बनाता है, जबकि वे अपने उत्पाद के लिए आंतरिक फाइन-ट्यून संस्करण भी बना सकते हैं। इस उद्योग में 'ओपन-फर्स्ट' मानसिकता, जिसे मुख्यतः व्यावहारिकता द्वारा परिभाषित किया गया है: यह मॉडल को मजबूत प्रतिक्रिया प्राप्त करने में मदद करती है, ओपन सोर्स समुदाय को लाभ पहुंचाती है, और अपने स्वयं के लक्ष्य को सशक्त बनाती है।
चौथा, सरकारी समर्थन वास्तविक है, लेकिन इसका पैमाना अभी अज्ञात है।
लोग अक्सर दावा करते हैं कि चीनी सरकार सक्रिय रूप से बड़े भाषा मॉडल प्रतियोगिता को खोलने में मदद कर रही है। लेकिन यह एक बहुत स्तरों वाली, अपेक्षाकृत विकेंद्रीकृत सरकारी प्रणाली है, और प्रत्येक स्तर के पास यह निर्धारित करने के लिए कोई स्पष्ट संचालन हैंडबुक नहीं है कि उसे वास्तव में क्या करना चाहिए।
बीजिंग के विभिन्न क्षेत्रों के बीच प्रतिस्पर्धा होती है, जिसमें वे तकनीकी कंपनियों को अपने क्षेत्र में कार्यालय स्थापित करने के लिए आकर्षित करने का प्रयास करते हैं। इन कंपनियों को प्रदान की जाने वाली 'सहायता' में लगभग निश्चित रूप से लाइसेंस आदि के ब्यूरोक्रेटिक प्रक्रियाओं से जुड़ी जटिलताओं को हटाना शामिल है। लेकिन इस सहायता की सीमा क्या है? सरकार के विभिन्न स्तर क्या प्रतिभा को आकर्षित करने में मदद कर सकते हैं? क्या वे चिप्स की तस्करी में मदद कर सकते हैं?
इस पूरे दौरे के दौरान, सरकारी रुचि या सहायता के बारे में कई उल्लेख हुए, लेकिन संबंधित जानकारी इतनी कम है कि मैं विवरणों की घोषणा करने के लिए निष्कर्ष नहीं निकाल सकता, और न ही मैं यह आत्मविश्वास से कह सकता हूँ कि सरकार चीन के AI विकास के पथ को कैसे बदल सकती है।
इसके अलावा, चीनी सरकार के उच्चतम स्तर के द्वारा मॉडल के किसी भी तकनीकी निर्णय पर प्रभाव डाले जाने का कोई भी संकेत नहीं है।
पाँचवें, डेटा उद्योग पश्चिमी देशों की तुलना में काफी कम विकसित है।
हमने पहले सुना था कि Anthropic या OpenAI एकल परिवेश के लिए 1000 डॉलर से अधिक खर्च करते हैं, और प्रबलन शिक्षा की सीमाओं को आगे बढ़ाने के लिए प्रति वर्ष कुल खर्च कई अरब डॉलर के स्तर पर होता है। इसलिए, हम यह जानना चाहते हैं कि क्या चीनी प्रयोगशालाएँ भी अमेरिकी कंपनियों से इन्हीं परिवेशों को खरीद रही हैं, या क्या उनका समर्थन करने के लिए एक प्रतिबिंबित आंतरिक पारिस्थितिकी तंत्र मौजूद है।
उत्तर यह नहीं है कि "कोई डेटा उद्योग नहीं है", बल्कि यह है कि उनके अनुभव के अनुसार, डेटा उद्योग की गुणवत्ता अपेक्षाकृत कम है, इसलिए अक्सर बेहतर विकल्प आंतरिक रूप से वातावरण या डेटा बनाना होता है। शोधकर्ता स्वयं रीइनफोर्समेंट लर्निंग ट्रेनिंग वातावरण बनाने में बहुत समय बिताते हैं, जबकि बाइटडांस, अलीबाबा जैसी बड़ी कंपनियाँ इसके लिए आंतरिक डेटा लेबलिंग टीमें रख सकती हैं। यह सब पहले उल्लिखित "खरीदने के बजाय स्वयं बनाएँ" के मानसिकता के साथ समानता रखता है।
छठा, न्यूडिया चिप्स के लिए बहुत तीव्र इच्छा है।
NVIDIA की कैलकुलेशन क्षमता ट्रेनिंग का स्वर्ण मानक है, और हर किसी की प्रगति अधिक कैलकुलेशन की कमी से सीमित है। यदि आपूर्ति उपलब्ध होती, तो स्पष्ट रूप से वे खरीदते। Huawei सहित अन्य एक्सेलरेटर्स, जिनमें शामिल नहीं हैं, इन्फरेंस के लिए सकारात्मक समीक्षा प्राप्त कर चुके हैं। असंख्य प्रयोगशालाएँ Huawei चिप्स का उपयोग कर सकती हैं।
ये बिंदु एक बहुत अलग AI पारिस्थितिकी को चित्रित करते हैं। पश्चिमी प्रयोगशालाओं के संचालन को चीनी सहयोगियों पर तुरंत लागू करने से अक्सर श्रेणीगत त्रुटि हो जाती है। मुख्य प्रश्न यह है कि क्या ये अलग-अलग पारिस्थितिकी वास्तविक अंतरों वाले मॉडल प्रकार उत्पन्न करेंगी; या क्या चीनी मॉडल हमेशा 3 से 9 महीने पहले के अमेरिकी अग्रणी मॉडल के समान व्याख्या किए जाएंगे।
निष्कर्ष: वैश्विक संतुलन
इस यात्रा से पहले, मुझे चीन के बारे में बहुत कम जानकारी थी; और जब मैं चला गया, तो मुझे लगा कि मैंने अभी तक सीखना शुरू किया है। चीन एक ऐसा स्थान नहीं है जिसे नियमों या रेसिपी से व्यक्त किया जा सके, बल्कि एक ऐसा स्थान है जहाँ बहुत अलग गतिविधियाँ और रासायनिक प्रतिक्रियाएँ हैं। इसका संस्कृति इतनी प्राचीन, इतनी गहरी है, और अभी भी देशी प्रौद्योगिकी निर्माण के तरीके के साथ पूरी तरह से जुड़ी हुई है। मुझे अभी भी कई चीजें सीखनी हैं।
अमेरिका के वर्तमान शक्ति संरचना के कई हिस्से, अपने मौजूदा चीनी दृष्टिकोण को निर्णय लेने में एक महत्वपूर्ण मानसिक उपकरण के रूप में उपयोग करते हैं। मैंने चीन के लगभग हर शीर्ष AI प्रयोगशाला के साथ औपचारिक या अनौपचारिक व्यक्तिगत बातचीत के बाद पाया कि चीन में कई गुण और प्राकृतिक प्रवृत्तियाँ हैं, जिन्हें पश्चिमी निर्णय लेने की विधि में मॉडल करना मुश्किल है।
भले ही मैंने सीधे इन प्रयोगशालाओं से पूछा कि वे अपने सबसे शक्तिशाली मॉडल को खुले तौर पर प्रकाशित क्यों कर रही हैं, मुझे अभी भी "स्वामित्व की मानसिकता" और "पारिस्थितिकी के प्रति ईमानदारी से समर्थन" के बीच के संबंध को पूरी तरह से जोड़ने में कठिनाई हो रही है।
यहाँ के प्रयोगशालाएँ बहुत व्यावहारिक हैं और ओपन सोर्स के निरपेक्षवादी नहीं हैं; उनके द्वारा बनाए गए हर मॉडल को खुले रूप से प्रकाशित नहीं किया जाता। लेकिन वे डेवलपर्स का समर्थन करने, पारिस्थितिकी का समर्थन करने, और खुलापन को अपने मॉडल को बेहतर ढंग से समझने का एक माध्यम मानने में गहरी इच्छा रखती हैं।
लगभग हर एक चीनी बड़ी टेक कंपनी अपना जनरल-पर्पस लार्ज लैंग्वेज मॉडल बना रही है। हमने देखा है कि मेतुआ जैसी प्लेटफॉर्म-आधारित सेवा कंपनियाँ और शाओमी जैसी बड़ी उपभोक्ता टेक कंपनियाँ ओपन-वेट मॉडल जारी कर चुकी हैं। अमेरिकी समकक्ष कंपनियाँ सामान्यतः केवल सेवाएँ खरीदती हैं।
ये कंपनियाँ बड़े भाषा मॉडल बना रही हैं, केवल लोकप्रिय नए चीजों में अपनी उपस्थिति दिखाने के लिए नहीं, बल्कि एक गहरी और मूलभूत इच्छा के कारण: अपनी तकनीकी स्टैक पर नियंत्रण रखना और आज की सबसे महत्वपूर्ण तकनीक को विकसित करना। जब मैं अपने लैपटॉप से सिर उठाता हूँ, तो हमेशा क्षितिज पर उठते हुए जहाजों के समूह देख पाता हूँ, जो चीन की व्यापक निर्माण संस्कृति और निर्माण ऊर्जा के साथ सुसंगठित है।
चीनी शोधकर्ताओं पर मानवीयता, आकर्षण और ईमानदारी से भरपूर गर्मजोशी बहुत निकटता महसूस कराती है। व्यक्तिगत स्तर पर, हम अमेरिका में जिस क्रूर भू-राजनीतिक चर्चा की आदत रखते हैं, वह उन पर कभी नहीं टिकी। इस दुनिया को ऐसी साधारण सकारात्मकता की और आवश्यकता है। AI समुदाय के एक सदस्य के रूप में, मैं अब अधिक चिंतित हूँ कि नागरिकता के लेबल के चारों ओर सदस्यों और समूहों के बीच दरारें उभर रही हैं।
अगर मैं कहूं कि मुझे अमेरिकी प्रयोगशालाओं को AI टेक स्टैक के हर हिस्से में स्पष्ट नेता बनने की इच्छा नहीं है, तो मैं झूठ बोल रहा हूँ। खासकर उन क्षेत्रों में जिनमें मैंने बहुत समय बिताया है, जैसे ओपन मॉडल, मैं एक अमेरिकी हूँ, और यह एक सच्ची पसंद है।
इसी बीच, मुझे आशा है कि खुला पारिस्थितिकी तंत्र वैश्विक स्तर पर समृद्ध होगा, क्योंकि इससे दुनिया के लिए अधिक सुरक्षित, अधिक उपलब्ध और अधिक उपयोगी AI बनेगी। और वर्तमान में सवाल यह है कि क्या अमेरिकी प्रयोगशालाएँ इस नेतृत्व की स्थिति को हासिल करने के लिए कदम उठाएँगी।
जब मैं इस लेख को पूरा कर रहा था, तो प्रशासनिक आदेश के प्रभाव के बारे में खुले मॉडल पर अधिक अफवाहें फैल रही थीं। इससे संयुक्त राज्य अमेरिका की नेतृत्व भूमिका और वैश्विक पारिस्थितिकी के बीच सहयोग और अधिक जटिल हो सकता है—जिससे मेरा आत्मविश्वास कम हो गया।
मैं मून ऑफ द डार्क साइड, ज़ही, मेइटुआन, शाओमी, टोन्गयी चियानवेन, मार्टिस लिंगगुआंग, 01.ai और अन्य संगठनों में मेरे साथ बातचीत करने वाले सभी उत्कृष्ट लोगों का आभारी हूँ। हर कोई इतना उत्साही था और अपना समय इतना उदारतापूर्वक दे रहा था। जैसे-जैसे मेरे विचार स्पष्ट होते जाएँगे, मैं चीन के बारे में अपने अवलोकन जारी रखूँगा, जिसमें व्यापक सांस्कृतिक पहलू और AI क्षेत्र के स्वयं के पहलू शामिल होंगे।
स्पष्ट है कि ये ज्ञान AI के अग्रणी विकास के साथ जुड़ी कहानी से सीधे संबंधित होंगे।
