เว่ยชินเปิดตัวระบบนิเวศของโปรแกรมขนาดเล็กที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ นำหน้าแอปเปิลในการบูรณาการปัญญาประดิษฐ์

ปัญญาประดิษฐ์ของ WeChat ได้เคลื่อนไหวแล้ว

ในวันเดียวกับ WWDC ของแอปเปิล วีแชทได้ทำสิ่งที่อาจสำคัญยิ่งกว่าแอปเปิล ด้วยการเผยแพร่ประกาศที่เรียบง่าย: “คู่มือการเชื่อมต่อผู้พัฒนาเข้ากับระบบนิเวศ AI ของวีแชท”

WeChat

ตั้งแต่วันนี้เป็นต้นไป นักพัฒนาโปรแกรมขนาดเล็กสามารถให้สิทธิ์แก่ AI ของ WeChat เพื่อให้สามารถอ่าน ดำเนินการ และเรียกใช้งานโปรแกรมขนาดเล็กได้

wechat ให้วิธีการเชื่อมต่อสองแบบ คือ “โหมดอัตโนมัติ” ซึ่งมีอุปสรรคแทบจะเป็นศูนย์ นักพัฒนาเพียงเปิดสวิตช์หนึ่งปุ่ม แพลตฟอร์มจะอ่านโค้ดแหล่งที่มา วิเคราะห์หน้าเว็บ และเข้าใจว่าแอปพลิเคชันเล็กๆ สามารถทำอะไรได้บ้าง จากนั้น AI ก็สามารถเริ่มดำเนินการได้ทันที โดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว

อีกแบบหนึ่งเรียกว่า “โหมดนักพัฒนา” นักพัฒนาสามารถสร้างทักษะที่ปรับแต่งเองได้ และเมื่อผ่านการตรวจสอบแล้ว จะถูกเรียกใช้งานโดย AI สามารถเปิดใช้งานทั้งสองแบบพร้อมกันได้ Meituan ได้ประกาศเข้าร่วมแล้ว

นี่ไม่ควรเข้าใจเพียงว่าเป็นการเปิดใช้งานฟีเจอร์ใหม่อีกอันหนึ่ง แต่ควรเห็นว่า WeChat กำลังเปลี่ยนระบบนิเวศทั้งหมดของมัน—โปรแกรมขนาดเล็กนับล้าน การชำระเงินผ่าน WeChat การแจ้งเตือนบริการ และบัญชีสาธารณะ—ให้กลายเป็นชั้นการดำเนินการของ AI

ตรวจสอบเอกสาร Skill ว่า AI ของ WeChat เรียกใช้小程序อย่างไร

เอกสารเปิดของ WeChat เปิดเผยข้อกำหนดทางเทคนิคสำหรับการเชื่อมต่อแอปพลิเคชันขนาดเล็กกับทักษะ AI ลองพิจารณาอย่างละเอียด คุณจะพบรายละเอียดการออกแบบมากมาย

เอกสารทักษะอย่างเป็นทางการ ดูที่👇🏻:

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

WeChat

จากมุมมองของสถาปัตยกรรม ผู้ที่เคยพัฒนา AI จะรู้ทันทีว่าโดยพื้นฐานแล้วคือ MCP โดย mcp.json ประกาศฟังก์ชันและพารามิเตอร์ของแต่ละอินเทอร์เฟซแบบอะตอม ส่วน SKILL.md อธิบายกระบวนการธุรกิจทั้งหมดว่าทำงานอย่างไร ซึ่งเหมือนกับสถาปัตยกรรม MCP+Skills ใน Claude, Cursor และ VS Code อย่างแท้จริง วีแชทไม่ได้สร้างระบบใหม่ แต่ใช้มาตรฐานที่อุตสาหกรรมกำลังรวมตัวกันอยู่โดยตรง

ในแผนการแนะนำ วีชีนได้กำหนดระบบ「น้ำหนักความสนใจ」ที่ชัดเจนมาก ในการตัดสินใจว่าจะเรียกใช้อินเทอร์เฟซใดและสร้างพารามิเตอร์ใด AI จะให้ความสำคัญสูงสุดกับ content ที่คืนกลับจากอินเทอร์เฟซ (ห้าดาว) ตามด้วย description ของอินเทอร์เฟซและพารามิเตอร์ในไฟล์ mcp.json (สี่ดาว) ส่วน SKILL.md จะอยู่ในลำดับสุดท้าย (สามดาว) ซึ่งหมายความว่า ตำแหน่งที่นักพัฒนาเขียนมีความสำคัญมากกว่าเนื้อหาที่เขียน — กฎเดียวกัน หากเขียนไว้ใน content ที่คืนกลับจากอินเทอร์เฟซ กับเขียนไว้ใน SKILL.md จะได้รับน้ำหนักที่ต่างกันอย่างมาก

WeChat

ในระดับการตอบกลับของอินเทอร์เฟซ มีกฎหลักหนึ่งข้อ: รูปแบบสองส่วนคือ “ข้อเท็จจริง + การกระทำ” ก่อนอื่นให้บอก AI ว่า “เกิดอะไรขึ้น” แล้วจึงบอกว่า “ต่อไปควรทำอะไร” หากเขียนเฉพาะการกระทำโดยไม่ระบุข้อเท็จจริง AI อาจตีความว่า “แสดงบัตร” หมายถึง “เตรียมเรียกอินเทอร์เฟซถัดไป” และข้ามการยืนยันจากผู้ใช้ไป นี่คือกฎที่สรุปได้หลังจากเคยเจอปัญหามาหลายครั้ง

WeChat

สี่ ให้ใช้ ID เป็นหลักแทนภาษาธรรมชาติในการส่งพารามิเตอร์ ตัวอย่างเช่น ในสถานการณ์การสั่งกาแฟในรูปภาพ หลังจากผู้ใช้ระบุความต้องการ ระบบ AI จะเข้าใจเจตนาที่คลุมเครือ ตัวเลือก การปรับเปลี่ยนสเปก และการจัดการการชำระเงิน โดยไม่ต้องออกจากกล่องสนทนา

การออกแบบชุดนี้สื่อถึงว่า WeChat ได้ทดลองใช้งานจริงมาแล้วจำนวนมาก และรู้ดีว่าจุดที่มักเกิดปัญหาในการเรียกใช้บริการภายนอกด้วย AI พร้อมทั้งถ่ายทอดประสบการณ์เหล่านั้นเป็นมาตรฐานสำหรับนักพัฒนา

ที่จริงแล้ว หากเปรียบเทียบกับ小程序ของเว่ยชีนและแอปของแอปเปิลที่มีชื่อเสียงในด้าน “ระบบนิเวศ” เว่ยชีนมีมุมมองแบบ “มีพระเจ้ามองเห็นทุกอย่าง” ต่อระบบนิเวศของตนเอง ซึ่งเป็นเงื่อนไขพื้นฐานของการดำเนินการทั้งหมด

สำคัญกว่า Apple AI ได้อย่างไร

Siri AI รุ่นใหม่ที่แอปเปิลเปิดตัวใน WWDC ปีนี้ แม้จะใช้ Google Gemini เป็นพื้นฐานและรองรับการสร้าง Shortcuts ด้วยภาษาธรรมชาติ แต่กลับไม่ได้รับการพูดถึงมากนัก

WeChat

เมื่อดูอย่างละเอียด จะเห็นความแตกต่าง: แอปเปิลทำหน้าที่ให้ AI ประสานงานฟังก์ชันพื้นฐานภายในระบบ iOS แต่เมื่อเกี่ยวข้องกับแอปของบุคคลที่สาม หรือแอปที่ติดตั้งอยู่บนโทรศัพท์ของคุณ มันจะเริ่มแสดงข้อจำกัด

ตัวอย่างเช่น Ele.me โค้ดของมันทำงานบนเซิร์ฟเวอร์ของ Ele.me เอง ซึ่ง Apple ไม่สามารถอ่านได้ หาก Siri ต้องการเรียกใช้งาน Ele.me จะต้องให้วิศวกรของ Ele.me เข้ามาเชื่อมต่ออินเทอร์เฟซ App Intents ทีละรายการ ต้องเจรจาและเชื่อมต่อทีละอัน ซึ่งใช้เวลาและแรงงานมาก

WeChat

ในขณะที่ WeChat ทำให้ AI สามารถควบคุมบริการภายนอกนับล้านรายการได้โดยตรง เนื่องจาก小程序นั้นแตกต่างกัน รหัสของแต่ละ小程序ตั้งแต่ผู้พัฒนาส่งขึ้น จนถึงขั้นตอนการตรวจสอบของ WeChat และสุดท้ายคือการรันบนโทรศัพท์ของผู้ใช้ ทั้งหมดอยู่ภายในระบบทะเบียนเทคโนโลยีของ WeChat WeChat สามารถสแกนรหัสในขั้นตอนการตรวจสอบและวิเคราะห์อัตโนมัติว่า “小程序 นี้มีหน้าจอใดบ้าง ทำอะไรได้บ้าง และอินพุต/เอาต์พุตคืออะไร”

ดังนั้นจึงสามารถใช้โหมดอัตโนมัติได้—นักพัฒนาไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว เปิดสวิตช์เพียงเท่านั้น วีแชทก็สามารถแปลแอปพลิเคชันเล็กๆ ของคุณเป็นเครื่องมือที่ AI สามารถเรียกใช้งานได้เอง โครงสร้างพื้นฐานของวีแชทมีความสามารถในการรองรับสิ่งนี้โดยธรรมชาติ เพราะมันมีมุมมองแบบ “พระเจ้า” ที่สามารถจัดการได้ผ่านระบบแบบศูนย์กลาง

ข้อได้เปรียบของสถาปัตยกรรมนี้ แอปเปิลไม่มี ไก่เกิลก็ไม่มี

นอกจากนี้ยังน่าสังเกตว่าเมื่อไม่นานมานี้ มีข่าวว่า WeChat กำลังร่วมมือกับ Huawei, Honor, Xiaomi, OPPO และ vivo เพื่อเปิดตัวความสามารถของตัวช่วย A2A (Agent-to-Agent) ผู้ใช้สามารถเริ่มต้นการโทรวิดีโอหรือส่งข้อความผ่าน WeChat ได้โดยตรงผ่านผู้ช่วยเสียงบนโทรศัพท์มือถือ

WeChat

ภายใน ไวน์ชีน AI สามารถเรียกใช้งานแอปพลิเคชันขนาดเล็กหลายล้านแอป; ภายนอก ผู้ผลิตโทรศัพท์มือถือสามารถเรียกใช้งานไวน์ชีนผ่านผู้ช่วย AI ของพวกเขา ไวน์ชีนกำลังกลายเป็นตัวเชื่อมต่อระดับซูเปอร์ในยุค AI ที่เป็นศูนย์กลางบริการที่ทุก AI สามารถเชื่อมต่อได้

คำทำนายเก่าของ "WeChat OS"

เมื่อเปิดตัวแอปพลิเคชันขนาดเล็ก หลายคนจึงล้อเลียนว่า WeChat กำลังจะสร้าง “WeChat OS” ในเวลานั้น มันดูเหมือนเป็นการใช้ถ้อยคำเชิงเปรียบเทียบ—แอปพลิเคชันขนาดเล็กแทนฟังก์ชันบางส่วนของแอป แต่โดยพื้นฐานยังคงเป็น “แพลตฟอร์มแอปแบบเบา”

ที่น่าสนใจยิ่งกว่านั้น กลไกการตรวจสอบแบบศูนย์กลางที่ออกแบบขึ้นในเวลานั้น มีจุดประสงค์เพื่อควบคุมคุณภาพและความปลอดภัย แต่เก้าปีต่อมา การออกแบบที่เคยถูกวิพากษ์วิจารณ์ว่า “ควบคุมมากเกินไป” กลับกลายเป็นข้อได้เปรียบด้านโครงสร้างพื้นฐานในยุคปัญญาประดิษฐ์ ระบบนิเวศแอปแบบกระจาย (Apple/Android) ในเวลานั้นดูเหมือน “เสรี” มากกว่า แต่ตอนนี้กลับกลายเป็นอุปสรรคต่อการเข้าถึงปัญญาประดิษฐ์

WeChat

คำทำนายเก่าที่ได้รับการเปลี่ยนแปลงอย่างพลิกผันเนื่องจากเทคโนโลยียุคใหม่—AI

ก่อนหน้านี้ เมื่อฉันเขียนเกี่ยวกับ OpenClaw และ Feishu ฉันได้เสนอข้อสรุปหนึ่งว่า IM เป็นช่องทางที่เป็นธรรมชาติที่สุดสำหรับ AI Agent เพราะการสนทนาคือวิธีการโต้ตอบที่เป็นธรรมชาติที่สุดระหว่างมนุษย์กับ AI และระบบนิเวศบริการที่ IM มีอยู่แล้ว (เช่น โรบอต การชำระเงิน แอปพลิเคชันขนาดเล็ก) ทำให้ AI ไม่เพียงแต่สามารถ “พูดคุย” ได้ แต่ยังสามารถ “ทำสิ่งต่างๆ” ได้ด้วย Feishu กำลังเดินไปในทิศทางนี้ โดยได้เปิดตัวการปรับปรุง Bot API และโหนด AI Agent

WeChat

อย่างไรก็ตาม ฟีชูเป็นเครื่องมือร่วมมือสำหรับองค์กร ซึ่งครอบคลุมบริบทของการทำงาน ในขณะที่เว่ยซินมีความกว้างขวางต่างกันอย่างสิ้นเชิง—มีผู้ใช้งานรายเดือน 1,432 ล้านคน และโปรแกรมย่อยหลายร้อยประเภท ตั้งแต่สั่งอาหาร นัดหมายแพทย์ ซื้อตั๋วเครื่องบิน ไปจนถึงชำระค่าไฟฟ้าและน้ำ แทบครอบคลุมความต้องการบริการทั้งหมดในชีวิตประจำวันของบุคคล

WeChat

หาก AI ของ WeChat สามารถเรียกใช้แอปเล็กๆ เหล่านี้เพื่อเสร็จสิ้นงานได้อย่างลื่นไหล ตามที่คาดการณ์ไว้ มันก็จะกลายเป็นระบบปฏิบัติการที่ควบคุมด้วยภาษาธรรมชาติ

ผู้ใช้พูดว่า “ช่วยจองตั๋วรถไฟความเร็วสูงจากปักกิ่งไปเซี่ยงไฮ้ตอนบ่ายสามโมงพรุ่งนี้” AI วิเคราะห์เจตนา ใช้งานโปรแกรมย่อย 12306 เพื่อตรวจสอบตั๋ว เลือกที่นั่ง และชำระเงินผ่าน WeChat เพื่อcompleteการสั่งซื้อ โดยไม่ต้องออกจาก WeChat สายการดำเนินการนี้สามารถทำงานได้จริงตั้งแต่วันนี้

แน่นอน ยังมีช่องว่างระหว่างทฤษฎีกับความเป็นจริง การเรียกใช้ AI ที่เกี่ยวข้องกับบริบทการชำระเงินมีอัตราความผิดพลาดใกล้ศูนย์—การสั่งกาแฟผิดเป็นเรื่องเล็ก แต่การซื้อตั๋วเครื่องบินผิดเป็นเรื่องใหญ่ ความแม่นยำของโมเดลพื้นฐานต้องสูงกว่าบริบทการสนทนาอย่างมาก นี่คือข้อจำกัดร่วมที่ AI Agent ทั่วโลกต้องเผชิญในการนำไปใช้งานจริง: ระหว่าง “พูดคุยได้” กับ “ทำสิ่งต่างๆ ได้” ไม่ใช่ตัวชี้วัดทางเทคนิคที่แยกแยะกัน แต่คือความเชื่อมั่น

WeChat

แต่เว่ยซินอย่างน้อยก็ทำสิ่งหนึ่งให้ถูกต้อง: มันไม่ได้สร้างเครือข่ายบริการตั้งแต่ศูนย์ ในช่วงหลายปีที่ผ่านมา สิ่งที่ ChatGPT ทำคือเริ่มต้นด้วยสมองที่ฉลาด จากนั้นจึงเชื่อมต่อกับ Shopify, DoorDash, Stripe ทีละราย แต่ละรายต้องสร้างการเชื่อมต่อใหม่ทั้งหมด จนถึงวันนี้ สัดส่วนของการสอบถามที่เกี่ยวข้องกับการทำธุรกรรมยังคงต่ำกว่า 3%

การเปลี่ยนแปลงที่แท้จริงที่กำลังจะเกิดขึ้น สำหรับผู้ใช้ส่วนใหญ่ อาจเกิดขึ้นอย่างเงียบๆ วันหนึ่งคุณพิมพ์ข้อความว่า “ช่วยจองตั๋วไปเซี่ยงไฮ้ตอนเก้าโมงเย็นวันนี้” บนเว่ยซิน แล้วมันก็จองให้คุณเสร็จเรียบร้อย โดยที่คุณอาจไม่รู้เลยว่ามีการเรียกใช้แอปเล็กๆ ใดบ้าง และกระบวนการชำระเงินใดที่ถูกดำเนินการ

การ “เสร็จสมบูรณ์โดยไม่รู้ตัว” นี้แหละคือสัญญาณของความเป็นผู้เชี่ยวชาญที่แท้จริงของ AI Agent วีแชทอยู่ใกล้ขั้นตอนนี้มากกว่าใครๆ

บทความนี้มาจาก微信号 “APPSO” โดยผู้เขียน: APPSO ผู้ค้นพบผลิตภัณฑ์แห่งอนาคต