Perplexity оголосила нову функцію на Computex 2026 у Тайбейі, плануючи запустити версію Perplexity Computer для Windows у липні. Система автоматично визначатиме, які частини AI-завдання виконуватимуться на локальному пристрої, а які — за допомогою хмарних моделей, не вимагаючи від користувача ручного переключення режимів.
Спочатку обробіть чутливий контент локально
Цю програму було представлено спільно з генеральним директором Perplexity Аравіндом Срінівасом та генеральним директором Intel Чен Ліву. Компанія називає її гібридною системою оркестрування локального та серверного висновку, зосереджуючись на одночасному врахуванні конфіденційності, продуктивності та вартості обчислювальних ресурсів.
Perplexity вказує, що такі дані, як фінансові записи, медична інформація та особисті документи, краще спочатку оцінювати за допомогою легковагової моделі на пристрої, щоб вирішити, чи залишати їх локально. Частина, що вимагає більшої здатності до міркувань, надсилається далі на хмарні великі моделі для обробки.
За словами компанії, завдання, такі як анотація документів, форматування тексту та легке класифікування, можна виконувати безпосередньо локально; складні міркування передаються на сервер. Увесь процес автоматично переключається під час виконання завдання, намагаючись зробити його непомітним для користувача.
Проте це не означає, що Perplexity надає користувачам повністю керований офлайн-модель. Локальні компоненти залишаються стислими моделями, інтегрованими в додаток Perplexity, а хмарна частина все ще працює через сервери Perplexity і не може вважатися повністю офлайн-рішенням.
Тиск на витрати є важливим контекстом
Під час Computex Срінівас у інтерв’ю сказав, що метою AI-систем має бути забезпечення більшої «вартості на ват» для кожного користувача, а не зосередження всіх обчислень на серверах та найбільших моделях. Він зазначив, що деякі компанії витрачають щомісяця на обчислювальні потужності понад сотні мільйонів доларів США.
Perplexity раніше повідомила, що дохід компанії збільшився з 100 мільйонів до 500 мільйонів доларів, тоді як кількість співробітників зросла лише на 34%. На цьому тлі перенесення частини навантаження на висновки на комп’ютери користувачів може безпосередньо знизити витрати на хмарні обчислювальні ресурси.
Це також одна з ключових причин, чому індустрія ШІ активно розвиває висновування на кінцевих пристроях. Для компаній локальне виконання зменшує витрати на сервери; для користувачів це означає, що деякі конфіденційні дані не залишають пристрій.
Галузь переходить до крайових та гібридних моделей
Зараз кілька технологічних компаній розробляють локальне або гібридне висновування. Apple виконує деякі чутливі операції на локальних чіпах; Foundry Local від Microsoft стала доступною у квітні цього року і підтримує локальне AI-висновування на Windows, macOS та Linux.
NVIDIA також представила RTX Spark під час Computex, спрямовуючи його на локальне висновування великих моделей на ноутбуках і стільникових комп’ютерах. Навпаки, відмінність Perplexity полягає не в самих моделях, а в шарі планування: система належним чином вирішує розподіл між локальними та хмарними ресурсами в реальному часі залежно від завдання, а не залишає це на вибір користувачеві заздалегідь.
Perplexity зазначила, що ця функція не обмежується лише платформами Intel. Хоча живе демонстрування використовувало процесори Intel Core Ultra Series 3, вона також підтримує процесори NVIDIA. Наразі підтверджено, що ця функція спочатку з’явиться у застосунках для Windows PC, а дати запуску на інших платформах ще не оголошено.
