Perplexity จะเปิดตัวระบบการอนุมาน AI แบบไฮบริดระหว่างโลคัลกับคลาวด์ในเดือนกรกฎาคม

CoinMarketCap รายงาน:

Perplexity ได้เปิดตัวคุณลักษณะใหม่ที่ Computex 2026 ที่ไทเป โดยวางแผนจะเปิดตัว Perplexity Computer เวอร์ชัน Windows ในเดือนกรกฎาคม ระบบจะระบุอัตโนมัติว่าส่วนใดของงาน AI ควรดำเนินการบนอุปกรณ์ท้องถิ่น และส่วนใดควรส่งไปยังโมเดลบนคลาวด์ โดยผู้ใช้ไม่จำเป็นต้องสลับโหมดด้วยตนเอง

จัดการเนื้อหาที่ละเอียดอ่อนก่อน

แผนนี้ได้รับการเปิดตัวร่วมกันโดย Aravind Srinivas ซีอีโอของ Perplexity และ Chen Liwu ซีอีโอของ Intel บริษัทเรียกมันว่าระบบการจัดการการประมวลผลแบบผสมระหว่างท้องถิ่นกับเซิร์ฟเวอร์ โดยเน้นการจัดการความเป็นส่วนตัว ประสิทธิภาพ และต้นทุนการประมวลผลในขั้นตอนเดียวกัน

Perplexity ระบุว่า เนื้อหาเช่น บันทึกทางการเงิน ข้อมูลสุขภาพ และเอกสารส่วนตัว ควรได้รับการประเมินโดยโมเดลขนาดเล็กบนอุปกรณ์ก่อนว่าควรเก็บไว้ที่ไหน ขณะที่ส่วนที่ต้องการความสามารถในการวิเคราะห์ที่แข็งแกร่งกว่า จะถูกส่งไปยังโมเดลขนาดใหญ่บนคลาวด์เพื่อประมวลผล

ตามที่บริษัทระบุ งานต่างๆ เช่น สรุปเอกสาร จัดรูปแบบข้อความ และการจัดหมวดหมู่แบบเบาๆ สามารถทำได้โดยตรงบนอุปกรณ์ของผู้ใช้ ในขณะที่การวิเคราะห์เชิงซับซ้อนจะถูกส่งไปยังเซิร์ฟเวอร์ กระบวนการทั้งหมดจะสลับอัตโนมัติระหว่างการดำเนินงาน โดยพยายามไม่ให้ผู้ใช้รับรู้

อย่างไรก็ตาม สิ่งนี้ไม่ได้หมายความว่า Perplexity ได้เปิดให้ผู้ใช้เข้าถึงโมเดลแบบออฟไลน์ที่ควบคุมได้อย่างสมบูรณ์ คอมโพเนนต์ที่ทำงานบนอุปกรณ์ยังคงเป็นโมเดลขนาดเล็กที่ Perplexity ผสานรวมไว้ในแอปพลิเคชัน ส่วนส่วนที่อยู่บนคลาวด์ก็ยังคงทำงานผ่านเซิร์ฟเวอร์ของ Perplexity และไม่สามารถถือว่าเป็นโซลูชันแบบออฟไลน์อย่างสมบูรณ์

ต้นทุนที่กดดันเป็นบริบทสำคัญ

สฤษดิ์ กล่าวในการสัมภาษณ์ระหว่าง Computex ว่า เป้าหมายของระบบ AI ควรเป็นการเพิ่ม "คุณค่าต่อวัตต์" ให้กับผู้ใช้แต่ละราย แทนที่จะเน้นการคำนวณทั้งหมดไปที่เซิร์ฟเวอร์และโมเดลขนาดใหญ่ที่สุด เขาระบุว่า บริษัทบางแห่งมีค่าใช้จ่ายด้านการประมวลผลถึงหลายร้อยล้านดอลลาร์สหรัฐต่อเดือน

Perplexity ได้เปิดเผยว่า รายได้ของบริษัทเพิ่มขึ้นจาก 100 ล้านดอลลาร์สหรัฐเป็น 500 ล้านดอลลาร์สหรัฐ ในขณะที่ขนาดทีมงานเพิ่มขึ้นเพียง 34% ในบริบทนี้ การย้ายภาระการประมวลผลบางส่วนไปยังคอมพิวเตอร์ของผู้ใช้สามารถลดค่าใช้จ่ายด้านพลังการประมวลผลบนคลาวด์ได้โดยตรง

นี่เป็นหนึ่งในเหตุผลสำคัญที่อุตสาหกรรม AI ขับเคลื่อนการประมวลผลแบบปลายทางในปัจจุบัน สำหรับบริษัท การรันแบบโลคัลช่วยลดต้นทุนเซิร์ฟเวอร์ สำหรับผู้ใช้ หมายความว่าข้อมูลที่ละเอียดอ่อนบางส่วนไม่จำเป็นต้องออกจากอุปกรณ์

อุตสาหกรรมกำลังเปลี่ยนไปสู่โมเดลขอบและแบบผสม

ในปัจจุบัน บริษัทเทคโนโลยีหลายแห่งกำลังขับเคลื่อนการประมวลผลแบบท้องถิ่นหรือแบบไฮบริด แอปเปิลดำเนินการประมวลผลข้อมูลที่ละเอียดอ่อนบางส่วนบนชิปท้องถิ่น ในขณะที่ Foundry Local ของไมโครซอฟท์เริ่มให้บริการอย่างเป็นทางการในเดือนเมษายนปีนี้ และรองรับการประมวลผล AI แบบท้องถิ่นบน Windows, macOS และ Linux

NVIDIA ยังได้เปิดตัว RTX Spark ระหว่าง Computex เพื่อมุ่งเป้าไปที่การอนุมานแบบโลคัลบนอุปกรณ์แล็ปท็อปและเดสก์ท็อป ในทางตรงกันข้าม จุดแตกต่างของ Perplexity ไม่ได้อยู่ที่โมเดลเอง แต่อยู่ที่ชั้นการจัดสรร: ระบบจะตัดสินใจแบ่งงานระหว่างโลคัลและคลาวด์แบบเรียลไทม์ตามภารกิจ แทนที่จะให้ผู้ใช้เลือกล่วงหน้า

Perplexity ระบุว่าฟีเจอร์นี้ไม่ได้จำกัดอยู่แค่บนแพลตฟอร์มชิปของอินเทล แม้ว่าการสาธิตแบบเรียลไทม์จะใช้โปรเซสเซอร์ Intel Core Ultra Series 3 แต่ก็รองรับชิปของนิวเดีย ปัจจุบันฟีเจอร์นี้ยืนยันแล้วว่าจะเปิดตัวครั้งแรกบนแอปสำหรับ Windows PC ส่วนเวลาการเปิดตัวบนแพลตฟอร์มอื่นยังไม่ได้ประกาศ