Perplexity akan melancarkan sistem inferens AI hibrida tempatan-awan pada Julai

Laman web dunia kripto melaporkan:

Perplexity mengumumkan ciri baharu di Computex Taipei 2026, dengan perancangan untuk melancarkan versi Windows Perplexity Computer pada bulan Julai. Sistem ini akan secara automatik menentukan bahagian mana tugas AI yang dijalankan di peranti tempatan dan bahagian mana yang diserahkan kepada model awan, tanpa perlu pengguna menukar mod secara manual.

Lokal terlebih dahulu tangani kandungan sensitif

Rancangan ini dilancarkan bersama oleh Aravind Srinivas, CEO Perplexity, dan Chen Liwu, CEO Intel. Syarikat menyebutnya sebagai sistem pengaturan inferens campuran tempatan–server, dengan penekanan pada penggabungan privasi, prestasi, dan kos pengkomputan dalam satu proses yang seragam.

Perplexity menyatakan bahawa kandungan seperti rekod kewangan, maklumat kesihatan, dan fail peribadi lebih sesuai dinilai terlebih dahulu oleh model ringan di peranti untuk menentukan sama ada ia harus disimpan secara tempatan. Bahagian yang memerlukan kemampuan penalaran yang lebih kuat akan dihantar ke model besar di awan untuk diproses.

Menurut perusahaan, tugas-tugas seperti ringkasan dokumen, penyusunan semula format teks, dan pengelasan ringan boleh dilakukan secara tempatan; penarikan kesimpulan yang kompleks akan dipindahkan ke pelayan. Keseluruhan proses akan beralih secara automatik semasa pelaksanaan tugas, sebanyak mungkin tanpa membuat pengguna sedar.

Namun, ini tidak bermakna Perplexity membuka model luar talian yang sepenuhnya boleh dikendalikan oleh pengguna. Komponen tempatan masih merupakan model ringkas yang diintegrasikan oleh Perplexity dalam aplikasi, dan komponen awan masih berjalan melalui pelayan Perplexity, dan tidak boleh dianggap sebagai penyelesaian luar talian sepenuhnya.

Tekanan kos adalah latar belakang penting

Srinivas dalam temu bual semasa Computex menyatakan bahawa matlamat sistem AI haruslah meningkatkan "nilai per watt" bagi setiap pengguna, bukan memusatkan semua pengiraan pada pelayan dan model terbesar. Beliau menyebut bahawa sebahagian syarikat telah mengeluarkan sehingga ratusan juta dolar AS setiap bulan untuk kuasa pengiraan.

Perplexity sebelum ini mengungkapkan, pendapatan syarikat telah meningkat dari $100 juta kepada $500 juta, sementara ukuran pekerja hanya meningkat 34%. Dalam konteks ini, memindahkan sebahagian beban inferens ke komputer pengguna boleh secara langsung mengurangkan perbelanjaan kuasa pengiraan awan.

Ini juga merupakan salah satu alasan utama mengapa industri AI sedang mendorong inferensi sisi peranti. Bagi perusahaan, menjalankan secara tempatan dapat mengurangkan kos pelayan; bagi pengguna, ia bermaksud sebahagian data sensitif tidak perlu keluar daripada peranti.

Industri sedang beralih ke model sisi end dan hibrida

Sekarang, banyak syarikat teknologi sedang memajukan inferens tempatan atau hibrid. Apple menjalankan sebahagian pemprosesan sensitif di cip tempatan; Foundry Local milik Microsoft kini tersedia sejak April tahun ini, menyokong inferens AI tempatan di Windows, macOS, dan Linux.

NVIDIA juga melancarkan RTX Spark semasa Computex, menargetkan inferens model tempatan pada peranti notebook dan desktop. Sebaliknya, perbezaan Perplexity bukan terletak pada model itu sendiri, tetapi pada lapisan penjadualan: sistem akan menentukan pembahagian tugas antara tempatan dan awan secara real-time, bukan meminta pengguna memilih terlebih dahulu.

Perplexity menyatakan bahawa ciri ini tidak terhad kepada Intel di platform cip. Walaupun demonstrasi langsung menggunakan prosesor Intel Core Ultra Series 3, ia juga menyokong prosesor NVIDIA. Sementara ini, ciri ini hanya telah disahkan akan dilancarkan terlebih dahulu pada aplikasi Windows PC, dan tarikh pelancaran untuk platform lain belum diumumkan.