Perplexity akan melancarkan sistem inferens AI hibrida tempatan-awan pada Julai

icon币界网
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Perplexity mengumumkan sistem inferensi AI hibrida tempatan-awan di Computex 2026, yang dijadualkan dilancarkan pada Julai bersama versi Windows Perplexity Computer. Sistem ini secara automatik membahagikan tugas AI antara pemprosesan tempatan dan awan, dengan mengutamakan privasi dan kecekapan kos. Data sensitif dijalankan secara tempatan, manakala tugas kompleks menggunakan awan. Ciri ini, yang diumumkan bersama oleh CEO Perplexity dan Intel, menyokong pemproses Intel dan NVIDIA. Berita AI + kripto ini menonjolkan inovasi utama dalam pemprosesan AI hibrida. Langkah ini selari dengan peningkatan kos awan dan tren komputasi tepi. Penjadualan masa nyata Perplexity merupakan pembeda utama dalam ruang berita AI + kripto.
Laman web dunia kripto melaporkan:

Perplexity mengumumkan ciri baharu di Computex Taipei 2026, dengan perancangan untuk melancarkan versi Windows Perplexity Computer pada bulan Julai. Sistem ini akan secara automatik menentukan bahagian mana tugas AI yang dijalankan di peranti tempatan dan bahagian mana yang diserahkan kepada model awan, tanpa perlu pengguna menukar mod secara manual.

Lokal terlebih dahulu tangani kandungan sensitif

Rancangan ini dilancarkan bersama oleh Aravind Srinivas, CEO Perplexity, dan Chen Liwu, CEO Intel. Syarikat menyebutnya sebagai sistem pengaturan inferens campuran tempatan–server, dengan penekanan pada penggabungan privasi, prestasi, dan kos pengkomputan dalam satu proses yang seragam.

Perplexity menyatakan bahawa kandungan seperti rekod kewangan, maklumat kesihatan, dan fail peribadi lebih sesuai dinilai terlebih dahulu oleh model ringan di peranti untuk menentukan sama ada ia harus disimpan secara tempatan. Bahagian yang memerlukan kemampuan penalaran yang lebih kuat akan dihantar ke model besar di awan untuk diproses.

Menurut perusahaan, tugas-tugas seperti ringkasan dokumen, penyusunan semula format teks, dan pengelasan ringan boleh dilakukan secara tempatan; penarikan kesimpulan yang kompleks akan dipindahkan ke pelayan. Keseluruhan proses akan beralih secara automatik semasa pelaksanaan tugas, sebanyak mungkin tanpa membuat pengguna sedar.

Namun, ini tidak bermakna Perplexity membuka model luar talian yang sepenuhnya boleh dikendalikan oleh pengguna. Komponen tempatan masih merupakan model ringkas yang diintegrasikan oleh Perplexity dalam aplikasi, dan komponen awan masih berjalan melalui pelayan Perplexity, dan tidak boleh dianggap sebagai penyelesaian luar talian sepenuhnya.

Tekanan kos adalah latar belakang penting

Srinivas dalam temu bual semasa Computex menyatakan bahawa matlamat sistem AI haruslah meningkatkan "nilai per watt" bagi setiap pengguna, bukan memusatkan semua pengiraan pada pelayan dan model terbesar. Beliau menyebut bahawa sebahagian syarikat telah mengeluarkan sehingga ratusan juta dolar AS setiap bulan untuk kuasa pengiraan.

Perplexity sebelum ini mengungkapkan, pendapatan syarikat telah meningkat dari $100 juta kepada $500 juta, sementara ukuran pekerja hanya meningkat 34%. Dalam konteks ini, memindahkan sebahagian beban inferens ke komputer pengguna boleh secara langsung mengurangkan perbelanjaan kuasa pengiraan awan.

Ini juga merupakan salah satu alasan utama mengapa industri AI sedang mendorong inferensi sisi peranti. Bagi perusahaan, menjalankan secara tempatan dapat mengurangkan kos pelayan; bagi pengguna, ia bermaksud sebahagian data sensitif tidak perlu keluar daripada peranti.

Industri sedang beralih ke model sisi end dan hibrida

Sekarang, banyak syarikat teknologi sedang memajukan inferens tempatan atau hibrid. Apple menjalankan sebahagian pemprosesan sensitif di cip tempatan; Foundry Local milik Microsoft kini tersedia sejak April tahun ini, menyokong inferens AI tempatan di Windows, macOS, dan Linux.

NVIDIA juga melancarkan RTX Spark semasa Computex, menargetkan inferens model tempatan pada peranti notebook dan desktop. Sebaliknya, perbezaan Perplexity bukan terletak pada model itu sendiri, tetapi pada lapisan penjadualan: sistem akan menentukan pembahagian tugas antara tempatan dan awan secara real-time, bukan meminta pengguna memilih terlebih dahulu.

Perplexity menyatakan bahawa ciri ini tidak terhad kepada Intel di platform cip. Walaupun demonstrasi langsung menggunakan prosesor Intel Core Ultra Series 3, ia juga menyokong prosesor NVIDIA. Sementara ini, ciri ini hanya telah disahkan akan dilancarkan terlebih dahulu pada aplikasi Windows PC, dan tarikh pelancaran untuk platform lain belum diumumkan.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.