पर्प्लेक्सिटी जुलाई में हाइब्रिड लोकल-क्लाउड AI इन्फरेंस सिस्टम लॉन्च करेगी

CoinDesk द्वारा रिपोर्ट किया गया:

Perplexity ने टाइपेई Computex 2026 पर एक नई सुविधा घोषित की है, जिसकी योजना जुलाई में Windows के लिए Perplexity Computer लॉन्च करने की है। यह सिस्टम स्वचालित रूप से निर्धारित करेगा कि AI कार्य के कौन से हिस्से स्थानीय उपकरण पर चलेंगे और कौन से हिस्से क्लाउड मॉडल पर प्रोसेस किए जाएंगे, जिससे उपयोगकर्ता को मोड बदलने की आवश्यकता नहीं होगी।

स्थानीय रूप से संवेदनशील सामग्री को संभालें

इस योजना को पर्प्लेक्सिटी के सीईओ अरविंद श्रीनिवास और इंटेल के सीईओ चेन लीवू ने साथ में लॉन्च किया। कंपनी इसे हाइब्रिड लोकल-सर्वर इन्फरेंस ऑर्केस्ट्रेशन सिस्टम कहती है, जिसका ध्यान गोपनीयता, प्रदर्शन और कैलकुलेशन लागत को एक ही प्रक्रिया में संभालने पर केंद्रित है।

Perplexity का कहना है कि वित्तीय रिकॉर्ड, स्वास्थ्य जानकारी और व्यक्तिगत फाइलों जैसी सामग्री को पहले डिवाइस पर एक हल्के मॉडल द्वारा यह निर्णय लेना चाहिए कि इसे स्थानीय रूप से रखा जाए या नहीं। जिन भागों को अधिक तर्क की आवश्यकता होती है, उन्हें बाद में क्लाउड पर बड़े मॉडल पर भेजा जाए।

कंपनी के अनुसार, दस्तावेज सारांश, पाठ फॉर्मेटिंग, हल्का वर्गीकरण आदि कार्य स्थानीय रूप से सीधे पूरे किए जा सकते हैं; जटिल तर्क को सर्वर पर सौंप दिया जाता है। पूरी प्रक्रिया कार्य निष्पादन के दौरान स्वचालित रूप से स्विच हो जाती है, ताकि उपयोगकर्ता को कुछ भी महसूस न हो।

हालांकि, इसका अर्थ यह नहीं है कि Perplexity उपयोगकर्ताओं को पूरी तरह से नियंत्रित ऑफलाइन मॉडल प्रदान करता है। स्थानीय घटक अभी भी Perplexity द्वारा एप्लिकेशन में एकीकृत संक्षिप्त मॉडल हैं, और क्लाउड घटक भी Perplexity सर्वर के माध्यम से ही चल रहे हैं, जिसे पूरी तरह से ऑफलाइन समाधान नहीं माना जा सकता।

लागत का दबाव महत्वपूर्ण पृष्ठभूमि है

स्रीनिवास ने कंप्यूटेक्स के दौरान एक साक्षात्कार में कहा कि AI प्रणालियों का लक्ष्य सभी कंप्यूटिंग को सर्वर और सबसे बड़े मॉडल पर केंद्रित करने के बजाय प्रत्येक उपयोगकर्ता के लिए अधिक "प्रति वाट मूल्य" प्रदान करना होना चाहिए। उन्होंने उल्लेख किया कि कुछ कंपनियाँ मासिक रूप से कंप्यूटेशनल पावर पर करोड़ों डॉलर खर्च कर रही हैं।

पर्प्लेक्सिटी ने पहले खुलासा किया था कि कंपनी की आय 1 अरब डॉलर से बढ़कर 5 अरब डॉलर हो गई है, जबकि कर्मचारी संख्या में केवल 34% की वृद्धि हुई है। इस संदर्भ में, कुछ निष्कर्षण लोड को उपयोगकर्ता के कंप्यूटर पर स्थानांतरित करने से क्लाउड की गणना लागत सीधे कम हो सकती है।

यह वर्तमान एआई उद्योग द्वारा एंड-साइड इन्फरेंस को बढ़ावा देने का एक महत्वपूर्ण कारण भी है। व्यवसायों के लिए, स्थानीय रूप से चलाने से सर्वर लागत में कमी होती है; उपयोगकर्ताओं के लिए, इसका अर्थ है कि कुछ संवेदनशील डेटा डिवाइस से बाहर नहीं जाता।

उद्योग एज और हाइब्रिड मॉडल की ओर बढ़ रहा है

वर्तमान में, कई प्रौद्योगिकी कंपनियाँ स्थानीय या मिश्रित निष्कर्षण पर काम कर रही हैं। ऐपल कुछ संवेदनशील प्रसंस्करण को स्थानीय चिप पर पूरा करता है; माइक्रोसॉफ्ट का Foundry Local इस वर्ष अप्रैल में लाइव हो गया है, जो Windows, macOS और Linux पर स्थानीय AI निष्कर्षण का समर्थन करता है।

NVIDIA ने Computex के दौरान RTX Spark भी लॉन्च किया, जो लैपटॉप और डेस्कटॉप डिवाइस पर स्थानीय बड़े मॉडल इन्फरेंस को लक्षित करता है। इसके विपरीत, Perplexity का अंतर मॉडल में नहीं, बल्कि स्केड्यूलिंग लेयर में है: सिस्टम कार्य के आधार पर वास्तविक समय में स्थानीय और क्लाउड के बीच विभाजन तय करता है, बजाय उपयोगकर्ता द्वारा पहले से चयन करने के।

Perplexity ने बताया कि यह फीचर केवल इंटेल प्लेटफॉर्म पर ही सीमित नहीं है। हालांकि लाइव डेमो Intel Core Ultra Series 3 प्रोसेसर का उपयोग करके किया गया था, लेकिन NVIDIA प्रोसेसर्स का भी समर्थन किया जाता है। वर्तमान में, यह फीचर केवल Windows PC ऐप पर पहले लॉन्च होने की पुष्टि की गई है, अन्य प्लेटफॉर्म पर लॉन्च का समय अभी घोषित नहीं किया गया है।