चीन का एआई इतना तेजी से क्यों विकसित हो रहा है? लैब्स से अंतर्दृष्टि

icon MarsBit
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
चीन का एआई क्षेत्र मजबूत इंजीनियरिंग फोकस, ओपन-सोर्स सहयोग और टीम-आधारित विकास के साथ तेजी से बढ़ रहा है। लैब्स व्यक्तिगत पहचान के बजाय कार्यान्वयन पर ध्यान केंद्रित करते हैं। अलीबाबा और बाइटडांस जैसी प्रमुख कंपनियों के प्रभाव के विस्तार के साथ एआई-संबंधित संपत्तियों में खुली रुचि बढ़ रही है। एआई बाजारों के लिए डर और लालच सूचकांक बढ़ती आशावादी भावना दर्शाता है। सरकारी समर्थन और डेटा अवसंरचना इस गति को और बढ़ाते हैं।

संपादकीय टिप्पणी: चीनी AI प्रयोगशालाएँ वैश्विक बड़े मॉडल प्रतिस्पर्धा में एक ऐसी शक्ति बन रही हैं जिनकी उपेक्षा करना मुश्किल होता जा रहा है। उनका लाभ केवल अधिक प्रतिभा, मजबूत इंजीनियरिंग और तेज़ अपडेट से ही नहीं है, बल्कि एक बहुत व्यावहारिक संगठनात्मक दृष्टिकोण से भी है: कम अवधारणाओं पर बात करें, अधिक मॉडल बनाएँ; कम व्यक्तिगत सितारों पर जोर दें, अधिक टीम के कार्यान्वयन पर; कम बाहरी सेवाओं पर निर्भर करें, और स्वयं कोर तकनीकी स्टैक पर कब्जा करने की प्रवृत्ति रखें।

लेखक नाथन लैम्बर्ट ने चीन के कई शीर्ष AI प्रयोगशालाओं की यात्रा के बाद पाया कि चीन का AI पारिस्थितिकी संस्थान अमेरिका के समान नहीं है। अमेरिका अनोखे पैटर्न, पूंजी निवेश और शीर्ष वैज्ञानिकों के व्यक्तिगत प्रभाव पर अधिक ध्यान केंद्रित करता है; जबकि चीन पहले से मौजूद दिशाओं पर तेजी से पीछा करने में कुशल है, जिसमें खुला स्रोत, इंजीनियरिंग अनुकूलन और बड़ी संख्या में युवा शोधकर्ताओं के योगदान के माध्यम से मॉडल क्षमताओं को जल्दी से अग्रणी स्तर तक पहुंचाया जाता है।

सबसे अधिक ध्यान देने योग्य बात यह नहीं है कि चीनी AI क्या संयुक्त राज्य अमेरिका को पार कर चुका है, बल्कि यह है कि दो अलग-अलग विकास मार्ग बन रहे हैं: संयुक्त राज्य अमेरिका अधिक रूप से पूंजी और सितारों के प्रयोगशालाओं द्वारा चलाई जा रही एक अग्रणी प्रतियोगिता की तरह है, जबकि चीन अधिक रूप से इंजीनियरिंग क्षमता, ओपन सोर्स पारिस्थितिकी और प्रौद्योगिकी स्वायत्तता की भावना द्वारा संचालित एक उद्योग-आधारित प्रतियोगिता की तरह है।

इसका अर्थ है कि भविष्य में AI प्रतिस्पर्धा केवल मॉडल रैंकिंग की लड़ाई नहीं होगी, बल्कि संगठनात्मक क्षमता, डेवलपर इकोसिस्टम और उद्योग की कार्यान्वयन क्षमता की लड़ाई भी होगी। चीनी AI में वास्तविक परिवर्तन यह है कि यह अब केवल सिलिकॉन वैली की नकल करना बंद कर रहा है, बल्कि अपने तरीके से वैश्विक अग्रणी क्षेत्र में हिस्सा ले रहा है।

नीचे मूल पाठ है:

हंगचोउ से शंघाई के लिए नए प्रकार की हाई-स्पीड ट्रेन में बैठकर, मैंने खिड़की से बाहर देखा, जहाँ उठान-गिरावट वाली पहाड़ियाँ दिख रही थीं, जिन पर विंड टरबाइन्स बिखरी हुई थीं और सूरज के अस्त होने के समय उनकी छायाएँ बन रही थीं। पहाड़ पृष्ठभूमि बन रहे थे, और सामने विशाल खेतों और ऊँची इमारतों के समूहों का मिश्रण दिख रहा था।

मैं बहुत विनम्रता के साथ चीन से लौटा। इतने अपरिचित स्थान पर इतनी गर्मजोशी से स्वागत किए जाने का अनुभव बहुत गर्म और मानवीय था। मैंने AI पारिस्थितिकी के कई लोगों से मुलाकात की, जिनके बारे में मैं पहले केवल दूर से जानता था; और उन्होंने मुझको चमकदार मुस्कानों और उत्साह के साथ स्वागत किया, जिससे मुझे फिर से एहसास हुआ कि मेरा काम और पूरी AI पारिस्थितिकी दोनों वैश्विक हैं।

चीनी शोधकर्ताओं का मनोभाव

चीन की कंपनियाँ, जो भाषा मॉडल बना रही हैं, इस तकनीक के लिए 'त्वरित अनुसरणकर्ता' होने के लिए बहुत उपयुक्त हो सकती हैं। वे लंबे समय से चीन की शिक्षा और कार्य संस्कृति पर आधारित हैं, और पश्चिमी देशों से थोड़ी अलग तकनीकी कंपनियों के निर्माण के तरीके भी अपनाती हैं।

यदि आप केवल आउटपुट—अर्थात् नवीनतम और सबसे बड़े मॉडल और इन मॉडलों द्वारा समर्थित एजेंट-आधारित वर्कफ्लो—को देखें, और इनपुट तत्व—जैसे उत्कृष्ट वैज्ञानिक, बड़े पैमाने पर डेटा और त्वरित कंप्यूटिंग संसाधन—को देखें, तो चीनी और अमेरिकी प्रयोगशालाएँ लगभग समान दिखती हैं। वास्तविक, दीर्घकालिक अंतर इन तत्वों के संगठन और आकार देने के तरीके में प्रकट होते हैं।

मैं हमेशा सोचता रहा कि चीनी प्रयोगशालाओं के आगे बढ़ने और अग्रणी स्थिति के पास बने रहने का एक कारण यह है कि उनकी संस्कृति इस कार्य के लिए बहुत अच्छी तरह से मेल खाती है। लेकिन बिना सीधे लोगों से बात किए, मुझे लगा कि मैं इस अनुभव को किसी महत्वपूर्ण प्रभाव के रूप में नहीं बता सकता। चीन की शीर्ष प्रयोगशालाओं में कई उत्कृष्ट, विनम्र और खुले वैज्ञानिकों से बात करने के बाद, मेरी कई बातें स्पष्ट हो गईं।

आज सबसे अच्छा बड़ा भाषा मॉडल बनाने के लिए, पूरी तकनीकी स्टैक में सूक्ष्म कार्य करना बहुत महत्वपूर्ण है: डेटा से लेकर आर्किटेक्चर विवरणों और रीइनफोर्समेंट लर्निंग एल्गोरिदम के कार्यान्वयन तक। मॉडल का प्रत्येक घटक कुछ सुधार ला सकता है, और इन सुधारों को एक साथ कैसे जोड़ा जाए, यह एक जटिल प्रक्रिया है। इस प्रक्रिया में, कुछ बहुत ही बुद्धिमान व्यक्तियों द्वारा किए गए कार्य को अक्सर एक बहु-लक्ष्य अनुकूलन में समग्र मॉडल को अधिकतम करने के लिए समय पर छोड़ना पड़ सकता है।

अमेरिकी शोधकर्ता स्पष्ट रूप से एकल घटकों की समस्याओं को हल करने में भी बहुत कुशल हैं, लेकिन अमेरिका में एक 'अपने लिए आवाज़ उठाने' की संस्कृति भी है। वैज्ञानिक के रूप में, जब आप अपने कार्य के लिए ध्यान आकर्षित करने के लिए सक्रिय रूप से प्रयास करते हैं, तो आप अक्सर अधिक सफल होते हैं; और समकालीन संस्कृति एक नई प्रसिद्धि की राह बना रही है, जो 'शीर्ष AI वैज्ञानिक' बनना है। इससे सीधा संघर्ष होगा।

बाहरी रूप से यह अफवाह है कि Llama संगठन ने इन हितों को संगठनात्मक स्तरों में शामिल करने के बाद राजनीतिक दबाव के कारण विघटित हो गया। मैंने अन्य प्रयोगशालाओं से भी सुना है कि कभी-कभी एक शीर्ष शोधकर्ता को 'शांत' करना आवश्यक होता है, ताकि वे अपने विचारों को अंतिम मॉडल में शामिल नहीं किए जाने की शिकायत करना बंद कर दें। चाहे यह पूरी तरह सच हो या नहीं, इसका मतलब स्पष्ट है: स्व-चेतना और पेशेवर उन्नति की इच्छा, वास्तव में लोगों को सर्वोत्तम मॉडल बनाने में बाधा डालती है। अमेरिका और चीन के बीच, यहां तक कि इस प्रकार का सांस्कृतिक सूक्ष्म दिशात्मक अंतर भी अंतिम परिणाम पर महत्वपूर्ण प्रभाव डाल सकता है।

इस अंतर का एक हिस्सा यह है कि चीन में ये मॉडल कौन बना रहा है। सभी प्रयोगशालाओं में एक सीधी वास्तविकता यह है कि मुख्य योगदानकर्ताओं में से एक बड़ा हिस्सा अभी भी पढ़ाई कर रहे छात्र हैं। ये सभी प्रयोगशालाएँ काफी युवा हैं, जो मुझे Ai2 में हमारे संगठन के तरीके को याद दिलाती हैं: छात्रों को साथी के रूप में देखा जाता है और उन्हें प्रत्यक्ष रूप से बड़े भाषा मॉडल टीम में शामिल किया जाता है।

यह अमेरिका के शीर्ष प्रयोगशालाओं से बहुत अलग है। अमेरिका में, OpenAI, Anthropic, Cursor जैसी कंपनियाँ बिल्कुल भी इंटर्नशिप नहीं देतीं। अन्य कंपनियाँ जैसे Google, Gemini से संबंधित इंटर्नशिप का दावा करती हैं, लेकिन कई लोग डरते हैं कि उनकी इंटर्नशिप वास्तविक केंद्रीय कार्यों से अलग हो सकती है।

सामान्य तौर पर, इस हल्की सांस्कृतिक भिन्नता के कारण मॉडल बनाने की क्षमता में सुधार हो सकता है: अंतिम मॉडल को बेहतर बनाने के लिए लोग उन कम चमकदार कार्यों को करने के लिए अधिक तैयार होते हैं; AI बनाने में शुरुआत करने वाले लोग पिछले AI बुलबुले के चक्रों से प्रभावित नहीं होते, इसलिए वे नए आधुनिक तकनीकी तरीकों को तेजी से अपना लेते हैं। वास्तव में, मैंने जिस चीनी वैज्ञानिक से बात की, उन्होंने इसे स्पष्ट रूप से एक लाभ के रूप में देखा; कम स्वयं-चेतना के कारण संगठनात्मक संरचना को कुछ हद तक आसानी से स्केल किया जा सकता है, क्योंकि लोग कम प्रयास करते हैं कि 'सिस्टम को धोखा दें'; बहुत सारे प्रतिभाशाली लोग ऐसी समस्याओं को हल करने के लिए बहुत उपयुक्त हैं, जिनके लिए अन्यत्र पहले ही प्रोटोटाइप सफलतापूर्वक सिद्ध हो चुके हैं, आदि।

यह वर्तमान भाषा मॉडल की क्षमता के निर्माण के लिए अधिक अनुकूल है, जो एक ज्ञात प्रतिबिंब के विपरीत है: लोग अक्सर मानते हैं कि चीनी शोधकर्ता कम ऐसे रचनात्मक, नए क्षेत्रों को खोलने वाले '0 से 1' के शैक्षणिक शोध का उत्पादन करते हैं।

इस यात्रा के दौरान कई अधिक शैक्षणिक प्रयोगशाला भ्रमणों में, कई प्रमुखों ने बताया कि वे इस अधिक दावेदार अनुसंधान संस्कृति को विकसित कर रहे हैं। इसी बीच, हमने जिन कुछ तकनीकी नेताओं से बात की, उन्होंने संदेह व्यक्त किया कि शैक्षणिक प्रणाली और प्रोत्साहन प्रणाली को पुनर्डिज़ाइन करने की आवश्यकता के कारण, इस वैज्ञानिक अनुसंधान दृष्टिकोण का पुनर्गठन छोटे समय में संभव हो सकता है, क्योंकि यह परिवर्तन बहुत बड़ा है और वर्तमान आर्थिक संतुलन में होना मुश्किल है।

यह संस्कृति ऐसे छात्रों और इंजीनियरों को तैयार कर रही है जो 'बड़े भाषा मॉडल बनाने का खेल' में बहुत कुशल हैं। निश्चित रूप से, उनकी संख्या भी अत्यधिक अधिक है।

इन छात्रों ने मुझे बताया कि अमेरिका की तरह ही चीन में भी कौशल का बहिर्गमन हो रहा है: जिन लोगों ने पहले शैक्षणिक मार्ग पर जाने की सोची थी, वे अब उद्योग के क्षेत्र में रहने की योजना बना रहे हैं। सबसे दिलचस्प बात एक ऐसे शोधकर्ता की थी, जो पहले प्रोफेसर बनना चाहता था, क्योंकि वह शिक्षा प्रणाली के करीब रहना चाहता था; लेकिन उसने बाद में टिप्पणी की कि शिक्षा को बड़े भाषा मॉडलों ने हल कर दिया है—“छात्र मुझसे बात करने क्यों आएंगे!”

छात्र बड़े भाषा मॉडल के क्षेत्र में नए दृष्टिकोण के साथ प्रवेश करते हैं, जो एक बड़ा लाभ है। पिछले कुछ वर्षों में, हमने बड़े भाषा मॉडल के मुख्य परिप्रेक्ष्य में लगातार परिवर्तन देखा है: MoE का विस्तार, रीइनफोर्समेंट लर्निंग का विस्तार, और एजेंट समर्थन तक। इनमें से किसी एक को सफलतापूर्वक करने के लिए, व्यापक साहित्य के साथ-साथ कंपनी के आंतरिक तकनीकी स्टैक सहित बहुत सारी पृष्ठभूमि सूचना को अत्यंत तेजी से समझने की आवश्यकता होती है।

छात्र इस तरह के काम करने के आदी होते हैं और 'क्या काम करना चाहिए' के सभी पूर्वधारणाओं को विनम्रता से छोड़ने को तैयार होते हैं। वे इसमें गहराई से उतर जाते हैं, अपना जीवन समर्पित करते हैं, ताकि मॉडल में सुधार का अवसर प्राप्त कर सकें।

ये छात्र बहुत ही सीधे और अद्भुत रूप से थे, और वे उन दार्शनिक चर्चाओं से बचते थे जो वैज्ञानिकों को विचलित कर सकती थीं। जब मैंने उनसे मॉडल के आर्थिक प्रभाव या दीर्घकालिक सामाजिक जोखिम के बारे में उनकी राय पूछी, तो जिन चीनी शोधकर्ताओं के पास जटिल दृष्टिकोण होते हैं और जो इन मुद्दों पर प्रभाव डालना चाहते हैं, वे स्पष्ट रूप से कम थे। उनका मानना था कि उनकी भूमिका केवल सर्वोत्तम मॉडल बनाना है।

यह अंतर सूक्ष्म है और आसानी से नकारा जा सकता है। लेकिन जब आप एक उचित, बुद्धिमान और अंग्रेजी में स्पष्ट रूप से व्यक्त करने में सक्षम शोधकर्ता के साथ लंबी बातचीत करते हैं, तो यह सबसे अच्छे से महसूस होता है: जब आप AI के बारे में कुछ अधिक दार्शनिक प्रश्न पूछते हैं, तो ये मूलभूत प्रश्न हवा में लटकते रहते हैं, और उनकी चेहरे पर सादगी से भ्रम का भाव दिखाई देता है। उनके लिए, यह एक श्रेणीगत त्रुटि है।

एक शोधकर्ता ने डैन वांग के प्रसिद्ध निर्णय का उल्लेख किया: अमेरिका वकीलों द्वारा शासित है, जबकि चीन इंजीनियरों द्वारा शासित है। इन मुद्दों पर चर्चा करते समय, उन्होंने इस तुलना का उपयोग अपनी निर्माण की इच्छा पर जोर देने के लिए किया। चीन में, ड्वार्केश या लेक्स जैसे सुपर-मेनस्ट्रीम पॉडकास्ट्स की तरह, चीनी वैज्ञानिकों के सितारे की पहचान को विकसित करने का कोई प्रणालिगत मार्ग नहीं है।

मैं चीनी वैज्ञानिकों से AI के कारण भविष्य की आर्थिक अनिश्चितता, साधारण AGI क्षमता से आगे बढ़ने वाले मुद्दों, या मॉडल के व्यवहार के नैतिक विवादों पर टिप्पणी करने का प्रयास कर रहा था; ये सभी प्रश्न मुझे अंततः इन वैज्ञानिकों के विकास के पृष्ठभूमि और शिक्षा के पृष्ठभूमि की ओर ले गए (संपादित 1)। वे अपने कार्य पर अत्यधिक केंद्रित हैं, लेकिन वे एक ऐसी प्रणाली में बड़े हुए हैं जो समाज को कैसे संगठित किया जाए और कैसे बदला जाए, इस पर चर्चा और अभिव्यक्ति को प्रोत्साहित नहीं करती है।

दूर से देखें, खासकर बीजिंग, यह मुझे बेयर एरिया जैसा लगता है: एक प्रतिस्पर्धी प्रयोगशाला, जो संभवतः कुछ कदम या टैक्सी से कुछ मिनट की दूरी पर है। मैंने अपने उड़ान के बाद होटल जाने के रास्ते में अलीबाबा बीजिंग कैंपस का दौरा किया। अगले 36 घंटों में, हमने Zhipu AI, Moonshot AI, त्सिंहुआ विश्वविद्यालय, Meituan, Xiaomi और 01.ai का दौरा किया।

चीन में डीडी एक्सिंग का उपयोग करना बहुत सुविधाजनक है। यदि आप XL वाहन विकल्प चुनते हैं, तो आपको अक्सर मसाज सीट वाली बिजली से चलने वाली छोटी बैंगनी वैन मिलती है। हमने शोधकर्ताओं से प्रतिस्पर्धा के बारे में पूछा, और उन्होंने कहा कि यह अमेरिका में हमारे अनुभव के बहुत समान है। शोधकर्ताओं का स्थान बदलना सामान्य है, और लोग यह तय करते हैं कि वे कहाँ जाएँ, जिस पर अधिकांशतः वर्तमान में कहाँ का माहौल सबसे अच्छा है, निर्भर करता है।

चीन में, बड़े भाषा मॉडल समुदाय एक पारस्परिक जीवन व्यवस्था की तरह महसूस होता है, न कि एक-दूसरे के साथ लड़ते हुए जनजातियों की तरह। कई गैर-सार्वजनिक बातचीत में, मैंने लगभग सभी सहयोगियों के प्रति सम्मान की बात सुनी है। सभी चीनी प्रयोगशालाएँ बाइटडांस और इसके लोकप्रिय डोबाओ मॉडल को बहुत सावधानी से देखती हैं, क्योंकि यह चीन की एकमात्र अग्रणी बंद स्रोत प्रयोगशाला है। इसके बीच, सभी प्रयोगशालाएँ DeepSeek को बहुत सम्मान करती हैं, क्योंकि इसे कार्यान्वयन स्तर पर सबसे अधिक शोध-स्वाद वाली प्रयोगशाला माना जाता है। अमेरिका में, जब आप प्रयोगशाला सदस्यों के साथ गैर-सार्वजनिक बातचीत करते हैं, तो आग की चिंगारियाँ जल्दी ही उड़ने लगती हैं।

चीनी शोधकर्ताओं की विनम्रता में, मुझे सबसे अधिक यह बात प्रभावित करती है कि वे व्यावसायिक स्तर पर अक्सर कंधे उठाकर कहते हैं कि यह उनकी समस्या नहीं है। जबकि अमेरिका में, ऐसा लगता है कि हर कोई डेटा सेलर से लेकर कैलकुलेशन क्षमता और फंडिंग तक, सभी पारिस्थितिक स्तर की उद्योग प्रवृत्तियों में फंसा हुआ है।

चीन के AI उद्योग और पश्चिमी प्रयोगशालाओं के बीच भिन्नताएँ और समानताएँ

आज एक AI मॉडल बनाना इतना दिलचस्प है क्योंकि यह अब केवल एक साथ एक बिल्डिंग में कुछ उत्कृष्ट शोधकर्ताओं को इकट्ठा करके एक इंजीनियरिंग चमत्कार बनाने की बात नहीं है। पहले ऐसा ही था, लेकिन AI बिजनेस को बनाए रखने के लिए, बड़े भाषा मॉडल एक मिश्रण बन रहे हैं: इसमें निर्माण, स्थापना, वित्तपोषण, और इस आविष्कार को अपनाया जाना शामिल है।

शीर्ष AI कंपनियाँ जटिल पारिस्थितिकी तंत्र में मौजूद होती हैं। ये पारिस्थितिकी तंत्र लगातार अग्रिम को आगे बढ़ाने के लिए वित्त, कंप्यूटिंग पावर, डेटा और अधिक संसाधन प्रदान करते हैं।

पश्चिमी पारिस्थितिकी तंत्र में, बड़े भाषा मॉडल बनाने और उन्हें बनाए रखने के लिए आवश्यक विभिन्न इनपुट तत्वों के एकीकरण के तरीके को अपेक्षाकृत पूरी तरह से संकल्पित और चित्रित किया जा चुका है। Anthropic और OpenAI इसके प्रमुख उदाहरण हैं। इसलिए, यदि हम यह पाते हैं कि चीनी प्रयोगशालाएँ इन मुद्दों पर अलग तरीके से सोचती हैं, तो हम यह समझ सकते हैं कि विभिन्न कंपनियाँ भविष्य में किन महत्वपूर्ण अंतरों पर निवेश कर सकती हैं। निश्चित रूप से, ये भविष्य वित्तपोषण और/या कैलकुलेशन क्षमता के प्रतिबंधों से भी मजबूती से प्रभावित होंगे।

मैंने इन प्रयोगशालाओं के साथ बातचीत के बाद प्राप्त कुछ प्रमुख «AI उद्योग स्तरीय» निष्कर्ष नीचे संकलित किए हैं:

पहला, घरेलू AI आवश्यकता में प्रारंभिक संकेत दिखाई दे चुके हैं।
एक व्यापक रूप से चर्चित मान्यता है कि चीनी AI बाजार छोटा होगा, क्योंकि चीनी कंपनियाँ आमतौर पर सॉफ्टवेयर के लिए भुगतान करने के लिए अनिच्छुक होती हैं, इसलिए एक ऐसा विशाल निष्कर्षण बाजार जो प्रयोगशालाओं को समर्थन दे सके, कभी भी मुक्त नहीं हो पाएगा।

लेकिन यह निर्णय केवल SaaS इकोसिस्टम के संगत सॉफ्टवेयर खर्च के लिए लागू होता है। और SaaS इकोसिस्टम चीन के इतिहास में हमेशा छोटा रहा है। दूसरी ओर, चीन में अभी भी एक विशाल क्लाउड बाजार है।

एक महत्वपूर्ण और अभी तक अनुत्तरित प्रश्न यह है कि चीनी कंपनियाँ AI पर खर्च करेंगी—क्या यह SaaS बाजार की तरह होगा, जो छोटा है; या बादल बाजार की तरह होगा, जो मूलभूत खर्च है। यह प्रश्न चीनी प्रयोगशालाओं के भीतर भी चर्चा का विषय है। सामान्य रूप से, मुझे लगता है कि AI बादल बाजार की ओर अधिक बढ़ रहा है, और कोई भी नए उपकरणों से बनने वाले बाजार के विकास की चिंता नहीं कर रहा है।

दूसरा, अधिकांश डेवलपर्स को क्लॉड का गहरा प्रभाव पड़ा है।
हालाँकि क्लॉड को चीन में औपचारिक रूप से प्रतिबंधित किया गया है, लेकिन चीन के अधिकांश एआई विकासक क्लॉड से बहुत प्रभावित हैं और यह कैसे उनके सॉफ्टवेयर बनाने के तरीके को बदल रहा है। यह केवल इसलिए कि चीन पिछले समय में सॉफ्टवेयर खरीदने के प्रति कम रुचि रखता था, इसका मतलब यह नहीं है कि मैं चीन में निष्कर्षण की मांग में भारी वृद्धि नहीं होगी, ऐसा मानूंगा।

चीनी तकनीकी कर्मचारी बहुत व्यावहारिक, विनम्र और प्रेरित होते हैं। यह बात मुझे किसी भी 'निःशुल्क सॉफ्टवेयर खरीदने' की पारंपरिक आदत से अधिक मजबूती से प्रभावित करती है।

कुछ चीनी शोधकर्ता अपने स्वयं के उपकरणों, जैसे कि किमी या GLM के कमांड लाइन टूल्स का उपयोग करने का उल्लेख करते हैं, लेकिन सभी क्लॉड का उपयोग करने का उल्लेख करते हैं। आश्चर्यजनक रूप से, कोडेक्स का उल्लेख बहुत कम किया जाता है, जबकि कोडेक्स बे एरिया में स्पष्ट रूप से तेजी से लोकप्रिय हो रहा है।

तीसरा, चीनी कंपनियों में तकनीकी स्वामित्व की मानसिकता होती है।
चीनी संस्कृति एक गर्जन करते हुए चल रहे आर्थिक इंजन के साथ मिल रही है, जिससे कुछ अप्रत्याशित परिणाम उत्पन्न हो रहे हैं। मेरे द्वारा छोड़ा गया एक गहरा अनुभव यह है कि AI मॉडल्स की बड़ी संख्या, यहाँ कई प्रौद्योगिकी कंपनियों की वास्तविकता में एक व्यावहारिक संतुलन को दर्शाती है। कोई कुल योजना नहीं है।

इस उद्योग को बाइटडांस और अलीबाबा के प्रति सम्मान से परिभाषित किया गया है। वे ऐसे बड़े स्थापित खिलाड़ी माने जाते हैं जो अपने मजबूत संसाधनों के कारण कई बाजारों में जीत हासिल करेंगे। डीपसीक एक सम्मानित तकनीकी नेता है, लेकिन बाजार का नेता दूर तक नहीं है। वे दिशा निर्धारित करते हैं, लेकिन बाजार में आर्थिक रूप से जीतने की संरचना नहीं रखते हैं।

इससे मेन्गुआन या एंट ग्रुप जैसी कंपनियाँ बच जाती हैं। पश्चिमी लोग आश्चर्यचकित हो सकते हैं कि इन कंपनियों के पास भी ये मॉडल बनाने का क्यों है। लेकिन वास्तव में, वे स्पष्ट रूप से बड़े भाषा मॉडल को भविष्य के तकनीकी उत्पादों का केंद्र मानते हैं, इसलिए उन्हें एक मजबूत आधार की आवश्यकता है।

जब वे एक शक्तिशाली सामान्य मॉडल को फाइन-ट्यून करते हैं, तो ओपन सोर्स समुदाय का मॉडल पर प्रतिक्रिया उनके टेक स्टैक को मजबूत बनाता है, जबकि वे अपने उत्पाद के लिए आंतरिक फाइन-ट्यून संस्करण भी बना सकते हैं। इस उद्योग में 'ओपन-फर्स्ट' मानसिकता, जिसे मुख्यतः व्यावहारिकता द्वारा परिभाषित किया गया है: यह मॉडल को मजबूत प्रतिक्रिया प्राप्त करने में मदद करती है, ओपन सोर्स समुदाय को लाभ पहुंचाती है, और अपने स्वयं के लक्ष्य को सशक्त बनाती है।

चौथा, सरकारी समर्थन वास्तविक है, लेकिन इसका पैमाना अभी अज्ञात है।
लोग अक्सर दावा करते हैं कि चीनी सरकार सक्रिय रूप से बड़े भाषा मॉडल प्रतियोगिता को खोलने में मदद कर रही है। लेकिन यह एक बहुत स्तरों वाली, अपेक्षाकृत विकेंद्रीकृत सरकारी प्रणाली है, और प्रत्येक स्तर के पास यह निर्धारित करने के लिए कोई स्पष्ट संचालन हैंडबुक नहीं है कि उसे वास्तव में क्या करना चाहिए।

बीजिंग के विभिन्न क्षेत्रों के बीच प्रतिस्पर्धा होती है, जिसमें वे तकनीकी कंपनियों को अपने क्षेत्र में कार्यालय स्थापित करने के लिए आकर्षित करने का प्रयास करते हैं। इन कंपनियों को प्रदान की जाने वाली 'सहायता' में लगभग निश्चित रूप से लाइसेंस आदि के ब्यूरोक्रेटिक प्रक्रियाओं से जुड़ी जटिलताओं को हटाना शामिल है। लेकिन इस सहायता की सीमा क्या है? सरकार के विभिन्न स्तर क्या प्रतिभा को आकर्षित करने में मदद कर सकते हैं? क्या वे चिप्स की तस्करी में मदद कर सकते हैं?

इस पूरे दौरे के दौरान, सरकारी रुचि या सहायता के बारे में कई उल्लेख हुए, लेकिन संबंधित जानकारी इतनी कम है कि मैं विवरणों की घोषणा करने के लिए निष्कर्ष नहीं निकाल सकता, और न ही मैं यह आत्मविश्वास से कह सकता हूँ कि सरकार चीन के AI विकास के पथ को कैसे बदल सकती है।

इसके अलावा, चीनी सरकार के उच्चतम स्तर के द्वारा मॉडल के किसी भी तकनीकी निर्णय पर प्रभाव डाले जाने का कोई भी संकेत नहीं है।

पाँचवें, डेटा उद्योग पश्चिमी देशों की तुलना में काफी कम विकसित है।
हमने पहले सुना था कि Anthropic या OpenAI एकल परिवेश के लिए 1000 डॉलर से अधिक खर्च करते हैं, और प्रबलन शिक्षा की सीमाओं को आगे बढ़ाने के लिए प्रति वर्ष कुल खर्च कई अरब डॉलर के स्तर पर होता है। इसलिए, हम यह जानना चाहते हैं कि क्या चीनी प्रयोगशालाएँ भी अमेरिकी कंपनियों से इन्हीं परिवेशों को खरीद रही हैं, या क्या उनका समर्थन करने के लिए एक प्रतिबिंबित आंतरिक पारिस्थितिकी तंत्र मौजूद है।

उत्तर यह नहीं है कि "कोई डेटा उद्योग नहीं है", बल्कि यह है कि उनके अनुभव के अनुसार, डेटा उद्योग की गुणवत्ता अपेक्षाकृत कम है, इसलिए अक्सर बेहतर विकल्प आंतरिक रूप से वातावरण या डेटा बनाना होता है। शोधकर्ता स्वयं रीइनफोर्समेंट लर्निंग ट्रेनिंग वातावरण बनाने में बहुत समय बिताते हैं, जबकि बाइटडांस, अलीबाबा जैसी बड़ी कंपनियाँ इसके लिए आंतरिक डेटा लेबलिंग टीमें रख सकती हैं। यह सब पहले उल्लिखित "खरीदने के बजाय स्वयं बनाएँ" के मानसिकता के साथ समानता रखता है।

छठा, न्यूडिया चिप्स के लिए बहुत तीव्र इच्छा है।
NVIDIA की कैलकुलेशन क्षमता ट्रेनिंग का स्वर्ण मानक है, और हर किसी की प्रगति अधिक कैलकुलेशन की कमी से सीमित है। यदि आपूर्ति उपलब्ध होती, तो स्पष्ट रूप से वे खरीदते। Huawei सहित अन्य एक्सेलरेटर्स, जिनमें शामिल नहीं हैं, इन्फरेंस के लिए सकारात्मक समीक्षा प्राप्त कर चुके हैं। असंख्य प्रयोगशालाएँ Huawei चिप्स का उपयोग कर सकती हैं।

ये बिंदु एक बहुत अलग AI पारिस्थितिकी को चित्रित करते हैं। पश्चिमी प्रयोगशालाओं के संचालन को चीनी सहयोगियों पर तुरंत लागू करने से अक्सर श्रेणीगत त्रुटि हो जाती है। मुख्य प्रश्न यह है कि क्या ये अलग-अलग पारिस्थितिकी वास्तविक अंतरों वाले मॉडल प्रकार उत्पन्न करेंगी; या क्या चीनी मॉडल हमेशा 3 से 9 महीने पहले के अमेरिकी अग्रणी मॉडल के समान व्याख्या किए जाएंगे।

निष्कर्ष: वैश्विक संतुलन

इस यात्रा से पहले, मुझे चीन के बारे में बहुत कम जानकारी थी; और जब मैं चला गया, तो मुझे लगा कि मैंने अभी तक सीखना शुरू किया है। चीन एक ऐसा स्थान नहीं है जिसे नियमों या रेसिपी से व्यक्त किया जा सके, बल्कि एक ऐसा स्थान है जहाँ बहुत अलग गतिविधियाँ और रासायनिक प्रतिक्रियाएँ हैं। इसका संस्कृति इतनी प्राचीन, इतनी गहरी है, और अभी भी देशी प्रौद्योगिकी निर्माण के तरीके के साथ पूरी तरह से जुड़ी हुई है। मुझे अभी भी कई चीजें सीखनी हैं।

अमेरिका के वर्तमान शक्ति संरचना के कई हिस्से, अपने मौजूदा चीनी दृष्टिकोण को निर्णय लेने में एक महत्वपूर्ण मानसिक उपकरण के रूप में उपयोग करते हैं। मैंने चीन के लगभग हर शीर्ष AI प्रयोगशाला के साथ औपचारिक या अनौपचारिक व्यक्तिगत बातचीत के बाद पाया कि चीन में कई गुण और प्राकृतिक प्रवृत्तियाँ हैं, जिन्हें पश्चिमी निर्णय लेने की विधि में मॉडल करना मुश्किल है।

भले ही मैंने सीधे इन प्रयोगशालाओं से पूछा कि वे अपने सबसे शक्तिशाली मॉडल को खुले तौर पर प्रकाशित क्यों कर रही हैं, मुझे अभी भी "स्वामित्व की मानसिकता" और "पारिस्थितिकी के प्रति ईमानदारी से समर्थन" के बीच के संबंध को पूरी तरह से जोड़ने में कठिनाई हो रही है।

यहाँ के प्रयोगशालाएँ बहुत व्यावहारिक हैं और ओपन सोर्स के निरपेक्षवादी नहीं हैं; उनके द्वारा बनाए गए हर मॉडल को खुले रूप से प्रकाशित नहीं किया जाता। लेकिन वे डेवलपर्स का समर्थन करने, पारिस्थितिकी का समर्थन करने, और खुलापन को अपने मॉडल को बेहतर ढंग से समझने का एक माध्यम मानने में गहरी इच्छा रखती हैं।

लगभग हर एक चीनी बड़ी टेक कंपनी अपना जनरल-पर्पस लार्ज लैंग्वेज मॉडल बना रही है। हमने देखा है कि मेतुआ जैसी प्लेटफॉर्म-आधारित सेवा कंपनियाँ और शाओमी जैसी बड़ी उपभोक्ता टेक कंपनियाँ ओपन-वेट मॉडल जारी कर चुकी हैं। अमेरिकी समकक्ष कंपनियाँ सामान्यतः केवल सेवाएँ खरीदती हैं।

ये कंपनियाँ बड़े भाषा मॉडल बना रही हैं, केवल लोकप्रिय नए चीजों में अपनी उपस्थिति दिखाने के लिए नहीं, बल्कि एक गहरी और मूलभूत इच्छा के कारण: अपनी तकनीकी स्टैक पर नियंत्रण रखना और आज की सबसे महत्वपूर्ण तकनीक को विकसित करना। जब मैं अपने लैपटॉप से सिर उठाता हूँ, तो हमेशा क्षितिज पर उठते हुए जहाजों के समूह देख पाता हूँ, जो चीन की व्यापक निर्माण संस्कृति और निर्माण ऊर्जा के साथ सुसंगठित है।

चीनी शोधकर्ताओं पर मानवीयता, आकर्षण और ईमानदारी से भरपूर गर्मजोशी बहुत निकटता महसूस कराती है। व्यक्तिगत स्तर पर, हम अमेरिका में जिस क्रूर भू-राजनीतिक चर्चा की आदत रखते हैं, वह उन पर कभी नहीं टिकी। इस दुनिया को ऐसी साधारण सकारात्मकता की और आवश्यकता है। AI समुदाय के एक सदस्य के रूप में, मैं अब अधिक चिंतित हूँ कि नागरिकता के लेबल के चारों ओर सदस्यों और समूहों के बीच दरारें उभर रही हैं।

अगर मैं कहूं कि मुझे अमेरिकी प्रयोगशालाओं को AI टेक स्टैक के हर हिस्से में स्पष्ट नेता बनने की इच्छा नहीं है, तो मैं झूठ बोल रहा हूँ। खासकर उन क्षेत्रों में जिनमें मैंने बहुत समय बिताया है, जैसे ओपन मॉडल, मैं एक अमेरिकी हूँ, और यह एक सच्ची पसंद है।

इसी बीच, मुझे आशा है कि खुला पारिस्थितिकी तंत्र वैश्विक स्तर पर समृद्ध होगा, क्योंकि इससे दुनिया के लिए अधिक सुरक्षित, अधिक उपलब्ध और अधिक उपयोगी AI बनेगी। और वर्तमान में सवाल यह है कि क्या अमेरिकी प्रयोगशालाएँ इस नेतृत्व की स्थिति को हासिल करने के लिए कदम उठाएँगी।

जब मैं इस लेख को पूरा कर रहा था, तो प्रशासनिक आदेश के प्रभाव के बारे में खुले मॉडल पर अधिक अफवाहें फैल रही थीं। इससे संयुक्त राज्य अमेरिका की नेतृत्व भूमिका और वैश्विक पारिस्थितिकी के बीच सहयोग और अधिक जटिल हो सकता है—जिससे मेरा आत्मविश्वास कम हो गया।

मैं मून ऑफ द डार्क साइड, ज़ही, मेइटुआन, शाओमी, टोन्गयी चियानवेन, मार्टिस लिंगगुआंग, 01.ai और अन्य संगठनों में मेरे साथ बातचीत करने वाले सभी उत्कृष्ट लोगों का आभारी हूँ। हर कोई इतना उत्साही था और अपना समय इतना उदारतापूर्वक दे रहा था। जैसे-जैसे मेरे विचार स्पष्ट होते जाएँगे, मैं चीन के बारे में अपने अवलोकन जारी रखूँगा, जिसमें व्यापक सांस्कृतिक पहलू और AI क्षेत्र के स्वयं के पहलू शामिल होंगे।

स्पष्ट है कि ये ज्ञान AI के अग्रणी विकास के साथ जुड़ी कहानी से सीधे संबंधित होंगे।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।