أعلنت Perplexity عن ميزة جديدة في معرض Computex 2026 في تايبيه، من المخطط إطلاق إصدار Windows من Perplexity Computer في يوليو. سيحدد النظام تلقائيًا أي أجزاء من مهمة الذكاء الاصطناعي يتم تشغيلها على الجهاز المحلي وأيها تُعالج بواسطة نماذج السحابة، دون الحاجة إلى تبديل الوضع يدويًا من قبل المستخدم.
معالجة المحتوى الحساس محليًا أولاً
تم الإعلان عن هذا الحل من قبل أرافيند سرينيفاس، الرئيس التنفيذي لشركة Perplexity، وتشين ليو، الرئيس التنفيذي لشركة إنتل. وتسميه الشركة نظام ترتيب استنتاج هجين محلي-خادم، مع التركيز على معالجة الخصوصية والأداء وتكلفة الحوسبة ضمن عملية واحدة.
تشير Perplexity إلى أن المحتويات مثل السجلات المالية ومعلومات الصحة والمستندات الشخصية، من الأفضل أن تُقيّم أولاً بواسطة نموذج خفيف على الجهاز لتحديد ما إذا كانت ستُحتفظ محليًا. ثم تُرسل الأجزاء التي تتطلب قدرات استدلال أقوى إلى نموذج أكبر في السحابة للمعالجة.
وفقًا للشركة، يمكن إنجاز مهام مثل تلخيص المستندات، وتنظيم تنسيق النص، والتصنيف الخفيف مباشرة على الجهاز المحلي؛ بينما تُنقل المهام المعقدة للخادم. يتم التبديل تلقائيًا خلال تنفيذ المهمة، مع الحد الأدنى من إدراك المستخدم.
ومع ذلك، فهذا لا يعني أن Perplexity تتيح للمستخدمين نموذجًا مُحكمًا بالكامل يعمل دون اتصال بالإنترنت. لا تزال المكونات المحلية عبارة عن نماذج مدمجة تُدمجها Perplexity في التطبيق، ولا تزال المكونات السحابية تعمل عبر خوادم Perplexity، ولا يمكن اعتبارها حلاً يعمل بالكامل دون اتصال بالإنترنت.
ضغط التكلفة هو خلفية مهمة
قال سرينيفاس خلال مقابلة خلال Computex إن هدف أنظمة الذكاء الاصطناعي يجب أن يكون توفير "قيمة أعلى لكل واط" لكل مستخدم، بدلاً من تركيز جميع العمليات الحسابية على الخوادم والنماذج الأكبر. وأشار إلى أن بعض الشركات تنفق مئات الملايين من الدولارات شهريًا على قوة الحوسبة.
كشفت Perplexity سابقًا أن إيرادات الشركة ارتفعت من 100 مليون دولار إلى 500 مليون دولار، بينما زاد حجم الموظفين بنسبة 34% فقط. في هذا السياق، نقل جزء من عبء الاستدلال إلى أجهزة المستخدمين يمكن أن يقلل مباشرةً من تكاليف قوة الحوسبة السحابية.
هذا أيضًا أحد الأسباب الرئيسية التي تدفع صناعة الذكاء الاصطناعي حاليًا نحو دفع الاستدلال على الحافة. بالنسبة للشركات، يعني التشغيل المحلي تقليل تكاليف الخوادم؛ أما بالنسبة للمستخدمين، فيعني أن بعض البيانات الحساسة لن تغادر الجهاز.
الصناعة تنتقل نحو النماذج الطرفية والمختلطة
حاليًا، تدفع عدة شركات تقنية نحو التفكير المحلي أو الهجين. تقوم آبل بتنفيذ بعض المعالجات الحساسة على الرقائق المحلية؛ وقد أصبحت Foundry Local الخاصة بشركة مايكروسوفت متاحة رسميًا في أبريل من هذا العام، وتدعم التفكير المحلي للذكاء الاصطناعي على أنظمة Windows وmacOS وLinux.
كما أطلقت نفيديا RTX Spark خلال حدث Computex، مستهدفة الاستنتاج المحلي للنماذج الكبيرة على أجهزة المحمول والسطحية. على النقيض من ذلك، لا يكمن الفرق في Perplexity في النموذج نفسه، بل في طبقة الجدولة: فالنظام يقرر في الوقت الفعلي توزيع المهام بين المحلي والسحابي، بدلاً من طلب من المستخدم اختيار ذلك مسبقًا.
أشارت Perplexity إلى أن هذه الميزة لا تقتصر على منصات شرائح Intel. على الرغم من أن العرض المباشر استخدم معالج Intel Core Ultra Series 3، إلا أنه يدعم أيضًا معالجات NVIDIA. حاليًا، تم تأكيد إطلاق هذه الميزة أولًا على تطبيقات Windows PC، ولم يُعلن بعد عن مواعيد إطلاقها على المنصات الأخرى.
