การขยายความสามารถของ Coding Agent ไปสู่สถานการณ์ทั่วไปเป็นการแข่งขันในระดับระบบ

ผู้เขียนบทความ แหล่งที่มา: NarrowCast AI

สำหรับสาขาปัญญาประดิษฐ์ นี่คือสัปดาห์ที่มีข่าวสำคัญออกมาอย่างต่อเนื่อง ตั้งแต่ฮวง เหรินซว่อล์ กำหนดนิยามใหม่ของ AI PC ไปจนถึง Microsoft Build 2026 ที่ประกาศแนวคิด “Agent First” OpenAI ประกาศรวม ChatGPT และ Codex เข้าด้วยกัน พร้อมเปิดเผยความคืบหน้าของ Agent บน WeChat การเชื่อมต่อทักษะจากบุคคลที่สามของ Qwen การตอบกลับของ DouBaoต่อข่าวลือเกี่ยวกับการชำระเงิน และการเน้นย้ำในงานประชุมรายงานผลการดำเนินงานของ Meituan ว่าการให้บริการผ่าน AI Agent กำลังกลายเป็นสิ่งสำคัญมากยิ่งขึ้น

ก่อนหน้านี้มีคนถามว่า OpenClaw ที่เคยโด่งดังแล้วทำไมไม่มีใครพูดถึงอีก? ข่าวที่ออกมาในสัปดาห์นี้ได้ตอบคำถามนี้ด้วยการกระทำ—ทุกคนไม่พูดถึง OpenClaw อีกต่อไป เพราะ Coding Agent ได้กลายเป็นแนวทางทั่วไปในการดำเนินงาน และเริ่มรวมเข้ากับ Chatbot พร้อมกับมีการสร้างระบบนิเวศของ Skill และ Agent ที่สอดคล้องกัน รวมถึงมีการสำรวจแบบจ่ายเงินใหม่ๆ กำลังดำเนินอยู่

บริษัทขนาดใหญ่กำลังแปลงแรงบันดาลใจจาก OpenClaw เป็นความก้าวหน้าทางธุรกิจที่แท้จริง ในกระบวนการนี้ OpenClaw และผลิตภัณฑ์ที่เราเห็นในขณะนี้อาจไม่ใช่รูปแบบสุดท้ายของผลิตภัณฑ์ AI ดังที่ Yao Shunyu นักวิทยาศาสตร์ AI หัวหน้าของ Tencent กล่าวในการประชุมแอปพลิเคชันอุตสาหกรรม AI ของ Tencent Cloud ปี 2026 การเปลี่ยนแปลงระยะยาวเพิ่งเริ่มต้นขึ้น รูปแบบผลิตภัณฑ์ โอกาสทางธุรกิจ และวิธีการใช้งานที่แท้จริงยังห่างไกลจากการถูกค้นพบอย่างเต็มที่

สิ่งที่เราสามารถระบุได้คือ ตัวแทนกำลังกลายเป็นสนามรบหลักของปัญญาประดิษฐ์ในบริษัทขนาดใหญ่ และรูปแบบการแข่งขันนี้กำลังพัฒนาไปตามแกนหลักสี่ประการ: ใครสามารถขยายผู้ใช้ในสถานการณ์ผลิตภาพที่หลากหลายได้มากกว่า; ใครสามารถเชื่อมโยงผลิตภัณฑ์ภายในได้อย่างลึกซึ้งกว่า; ใครสามารถสร้างระบบนิเวศของทักษะและตัวแทนที่อุดมสมบูรณ์เพียงพอ; และใครสามารถสะสมบริบทที่เพียงพอ

เพื่อนร่วมงานกลายเป็นจุดแข่งขันหลักของตัวแทน

“เพื่อนร่วมงาน” เป็นคำที่มักถูกกล่าวถึงที่สุดเมื่ออธิบายตัวแทนในปัจจุบัน ไมโครซอฟท์ออกแบบ Scout ให้ทำงาน “เหมือนเพื่อนร่วมงาน” ขณะที่ Koto 3.0 เน้นการให้ผู้คนร่วมทำงานกับทีม AI และปลั๊กอินตัวแทนของ OpenAI ถูกอธิบายว่าเป็น “เพื่อนร่วมงานคนใหม่ที่เข้ามาทำงานแล้วและเข้าใจขั้นตอนทั้งหมด”

คำกล่าวเหล่านี้หมายความว่า สถานการณ์ด้านผลิตภาพได้กลายเป็นจุดสนใจของการแข่งขันของตัวแทนจากบริษัทขนาดใหญ่

Scout ที่微软เปิดตัว เป็นเอเจนต์ที่สร้างขึ้นบนกรอบงาน OpenClaw ซึ่งทำงานแบบคงที่ภายใน Microsoft 365 สามารถรันได้ใน Teams และทำงานร่วมกับแอปพลิเคชันสำนักงานต่างๆ เช่น Outlook และ OneDrive เพื่อท่องเว็บอีเมล ปฏิทิน และข้อความการทำงาน จัดการความขัดแย้งของการประชุม ร่างคำตอบ และผลักดันงานอัตโนมัติ พร้อมกันนี้ Microsoft ยังได้เปิดตัว Agent 365 เพื่อจัดการเอกลักษณ์ สิทธิ์ นโยบาย และความเสี่ยงของเอเจนต์อย่างเป็นระบบสำหรับองค์กร

OpenAI ได้ตั้งหัวข้อการเปิดตัวว่า “Intelligence at Work” โดยในการเปิดตัวครั้งนี้ OpenAI ได้ทำการอัปเกรด Codex สามประการหลัก: เปิดตัวปลั๊กอิน Agent ที่สามารถปรับแต่งได้; ขยายความสามารถในการแก้ไขคำอธิบายย่อจากโค้ดและเว็บเพจไปยังเอกสาร ตาราง และ PPT; และเพิ่มความสามารถในการสร้างเว็บไซต์เพื่อรายงานผลลัพธ์

ในขณะเดียวกัน โดว์บาวได้ระบุในคำตอบเกี่ยวกับฟีเจอร์แบบจ่ายเงินว่า เพื่อตอบสนองความต้องการด้านผลิตภาพของผู้เชี่ยวชาญ โดว์บาววางแผนจะเปิดตัวโดว์บาวโปรเฟสชันนัล ซึ่งจะรวมบริการเฉพาะทาง เช่น การพัฒนาซอฟต์แวร์ การวิเคราะห์ข้อมูล การออกแบบแบบมืออาชีพ การอัตโนมัติของกระบวนการ การวิเคราะห์ทางการเงิน และการวิจัยทางวิทยาศาสตร์

การดำเนินการผลิตภัณฑ์เหล่านี้แสดงให้เห็นว่า คุณค่าที่ยิ่งใหญ่ของสถานการณ์ด้านผลิตภาพ—ไม่ใช่แค่ในบริบทองค์กรแบบดั้งเดิม—ได้รับการยืนยันด้วยเงินจริง

ข้อมูลที่ OpenAI เปิดเผยแสดงว่าตั้งแต่เดือนกุมภาพันธ์ปีนี้ จำนวนผู้ใช้งานรายสัปดาห์ของ Codex เพิ่มขึ้นหกเท่าเป็น 5 ล้านคน โดยกลุ่มผู้เชี่ยวชาญด้านความรู้มีอัตราการเติบโตเร็วกว่าผู้พัฒนาสามเท่า Anthropic คาดว่ารายได้ในไตรมาสที่สองจะเพิ่มขึ้นเกินกว่าสองเท่าเป็น 10.9 พันล้านดอลลาร์สหรัฐ และอาจทำกำไรจากการดำเนินงานได้ 559 ล้านดอลลาร์สหรัฐ โดยรายได้ส่วนใหญ่มาจากการดำเนินงานของบริษัทและสตาร์ทอัพ

การบูรณาการและการเชื่อมต่อผลิตภัณฑ์ภายในกำลังลึกซึ้งยิ่งขึ้น

การอัปเดตและพัฒนาผลิตภัณฑ์นั้นสอดคล้องกับการจัดโครงสร้างผลิตภัณฑ์ในระดับที่ลึกกว่า ด้านหนึ่ง ขณะนี้บริษัทขนาดใหญ่เกือบทั้งหมดได้เข้าสู่ตลาด Chatbot และผลิตภัณฑ์ Agent หนึ่งหรือหลายตัว ซึ่งการบูรณาการผลิตภัณฑ์เหล่านี้เริ่มขึ้นแล้ว โดยที่รุนแรงที่สุดคือการรวมกันของ OpenAI ระหว่าง ChatGPT และ Codex

OpenAI ต้องการยกระดับ ChatGPT จากช่องทางการสนทนาเพียงอย่างเดียว ให้กลายเป็นอินเทอร์เฟซหลักสำหรับการทำงานร่วมกับ Agent ขณะเดียวกัน Codex จะถูกยกระดับให้เป็นแพลตฟอร์ม Agent ทั่วไปที่สามารถรองรับความต้องการในการทำงานหลากหลาย เช่น การดำเนินงาน การวิจัยทางวิชาการ กระบวนการขององค์กร การวิเคราะห์ข้อมูล และการดำเนินธุรกิจ โดยมีแกนหลักคือการขยายขอบเขตการใช้งานของ Coding Agent ผ่านการรวมกันครั้งนี้ OpenAI หวังว่าจะขยายการใช้งาน Codex ไปยังกลุ่มผู้ใช้จำนวนมากของ ChatGPT เพื่อเพิ่มจำนวนผู้ใช้ที่จ่ายเงิน

ยังมีข่าวระบุว่า OpenAI วางแผนให้เบราว์เซอร์ AI ชื่อ Atlas เข้าร่วมในการบูรณาการแอปพลิเคชัน AI ระดับซูเปอร์นี้ด้วย

ในอีกด้านหนึ่ง ความสามารถและบริการผลิตภัณฑ์อินเทอร์เน็ตเดิมของบริษัทขนาดใหญ่กำลังถูกรวมเข้ากับผลิตภัณฑ์ AI อย่างรวดเร็วในรูปแบบของ Skill หรือ Agent อาลีบาบาได้เพิ่มฟังก์ชันการสั่งอาหาร การเรียกรถแท็กซี่ และการช้อปปิ้งบน Taobao ให้กับ Qwen ซึ่งเป็นการทดลองในระยะเริ่มต้น ขณะนี้ เราสามารถเห็นว่า ByteDance Meituan และ Tencent กำลังดำเนินงานในลักษณะเดียวกัน

ไบต์ได้ขยายการแนะนำร้านค้าและชุดโปรโมชันสำหรับบริการชีวิตประจำวัน เช่น อาหาร ตั๋วหนัง และที่พักแบบโฮมสเตย์ หลังจากเชื่อมต่อโดว์บาโอเข้ากับร้านค้าบนดูยิน ไม่กวนได้ระบุในการประชุมรายงานผลการดำเนินงานว่า ผู้ช่วย AI “เสี่ยวตuan” ถูกผนวกเข้าไปในแอปของไม่กวน และให้บริการผู้ใช้มากกว่าหนึ่งพันล้านคนในช่วงวันหยุดวันที่หนึ่งเดือนพฤษภาคม ครอบคลุมบริบทต่างๆ เช่น การรับประทานอาหาร การพักผ่อน การเดินทาง และการปรึกษาแพทย์ ขณะที่เอกสารของเทนเซนต์ยังได้แปลงความสามารถในการจัดการเอกสารที่สะสมมาให้กลายเป็น Skill ซึ่งถูก WorkBuddy เรียกใช้งาน

汤道生 หัวหน้าผู้บริหารระดับสูงของ Tencent Group กล่าวระหว่างการประชุม Tencent Cloud AI Industry Application 2026 ว่า ฟังก์ชันของแอปพลิเคชันดั้งเดิมจำนวนมากจำเป็นต้องแปลงเป็นความสามารถที่เอเจนต์อัจฉริยะสามารถเรียกใช้ได้ เพื่อปลดปล่อยมูลค่าที่สะสมมาหลายปี ดังนั้นในปีนี้ WeCom จึงได้เปิดเผยความสามารถด้านข้อมูลบางอย่างเดิมผ่านอินเทอร์เฟซและ Skill เพื่อให้เอเจนต์อื่นๆ สามารถเรียกใช้ได้ แนวโน้มการเปิดเผยนี้ชัดเจนขึ้นเรื่อยๆ

การสร้างระบบนิเวศภายนอกเริ่มถูกนำเข้าสู่วาระการประชุม

ความแตกต่างหลักของ Agent กับผลิตภัณฑ์ก่อนหน้าคือ มันมีความสามารถในการเรียกใช้เครื่องมือ ซึ่งต้องการให้ Agent ด้านหลังมีระบบนิเวศของเครื่องมือที่หลากหลายเพียงพอ แม้แต่บริษัทขนาดใหญ่ก็ยากที่จะสร้างระบบนิเวศนี้ขึ้นมาด้วยตัวเองเพียงลำพัง จึงจำเป็นต้องพึ่งพาการพัฒนาระบบนิเวศของ Skill หรือ Agent จากบุคคลที่สาม

การสร้างระบบนิเวศนี้ได้ถูกนำเข้าสู่วาระการประชุมแล้ว

หลังจากเสร็จสิ้นการบูรณาการผลิตภัณฑ์และบริการของ阿里ภายในองค์กร ฉีเหวินประกาศเปิดโอกาสให้ Agent และ Skill ของบุคคลที่สามสามารถใช้งานได้อย่างเต็มรูปแบบ ทำให้บริษัททุกแห่งสามารถดำเนินการ Agent ของแบรนด์ตนเองผ่านฉีเหวิน อาทิเช่น Luckin Coffee, KFC, Mixue Ice Cream & Tea และ China Eastern Airlines ได้เปิดตัว Skill บนฉีเหวินแล้วในสัปดาห์นี้ ต่อมา บริษัทต่างๆ ยังสามารถกำหนดลักษณะและบริการเฉพาะของ Agent ได้เองผ่านฉีเหวิน

腾讯一方面将美团的小美接入元宝，为用户提供外卖订餐、配送等服务；另一方面加速微信 Agent 生态的建设。

สื่อรายงานว่า Agent ของ WeChat ได้เสร็จสิ้นการทดสอบต้นแบบ และอาจเริ่มกระบวนการตรวจสอบความถูกต้องตามกฎหมายก่อนเปิดให้บริการอย่างเป็นทางการภายในเดือนนี้ Agent นี้สามารถจัดการแอปพลิเคชันย่อยของ WeChat เพื่อให้บริการแบบรวม เช่น การสั่งอาหาร การเรียกรถแท็กซี่ การจองตั๋ว การช้อปปิ้ง และบริการชีวิตประจำวันในท้องถิ่น

นอกจากนี้ วีชั่นยังกำลังพยายามสร้างการเชื่อมต่อแบบ Agent to Agent กับผู้ผลิตโทรศัพท์ เช่น Honor และ Xiaomi เพื่อให้ความสามารถพื้นฐานของตนเองสามารถถูกเรียกใช้งานโดย Agent ของผู้ผลิตโทรศัพท์ กล่าวคือ ผู้ผลิตโทรศัพท์จะกลายเป็นจุดเข้าใช้งานใหม่ในระบบนิเวศ Agent ของวีชั่น สร้างสถาปัตยกรรมที่มีหลายจุดเข้าใช้งานแต่ใช้ระบบนิเวศ Agent ร่วมกัน

ปลั๊กอินเอเจนต์ของ OpenAI สามารถแพ็กเกจเครื่องมือ ความรู้ และทักษะที่จำเป็นสำหรับตำแหน่งงานทั้งหมดในครั้งเดียว ตัวอย่างเช่น ปลั๊กอินการผลิตเนื้อหาสร้างสรรค์สามารถสร้าง campaign board, ตัวเลือกโฆษณาแสดงผล, ภาพชีวิตประจำวันของผลิตภัณฑ์ และชุดภาพสำหรับอีคอมเมิร์ซ พร้อมทั้งเรียกใช้เครื่องมือต่างๆ เช่น Figma, Canva, Shutterstock, Picsart, Fal เป็นต้น โดยเข้าใจอย่างง่าย นี่คือระบบการสืบทอดวิชาชีพที่ออกแบบมาเพื่อเอเจนต์

ปัจจุบันปลั๊กอิน Agent ของ Codex ครอบคลุมแอปยอดนิยม 62 แอปและทักษะ 110 ทักษะ ในอนาคต OpenAI ตั้งใจเปิดระบบนิเวศปลั๊กอินให้พันธมิตรสามารถสร้างและปรับใช้ปลั๊กอินของตนเองได้โดยตรงบน Codex และ ChatGPT

บริบทมีความสำคัญมากขึ้น

ยáo ซุนยูระบุว่า แบบจำลองกำลังเชี่ยวชาญขึ้นในการแปลงข้อมูลนำเข้าที่ซับซ้อนให้เป็นผลลัพธ์ แต่เงื่อนไขคือต้องได้รับข้อมูลนำเข้าที่ดีเพียงพอ ซึ่งต้องการให้ผู้ใช้สามารถจัดเตรียมข้อมูลที่ละเอียดและมีประโยชน์เพียงพอสำหรับแบบจำลองและเอเจนต์ เพื่อให้แบบจำลองและเอเจนต์สามารถเข้าใจคำถามที่ช่วยกำหนดเส้นทางที่ถูกต้อง เช่น “คุณคือใคร” “คุณกำลังทำอะไรอยู่” และ “คำตอบใดที่มีคุณค่าสำหรับคุณ”

ในด้านการพัฒนา สำหรับการพัฒนาผลิตภัณฑ์ AI จำเป็นต้องมีการสื่อสารบริบทอย่างเพียงพอ เหยาซุนยูและถังดาวเซิงได้กล่าวในการสนทนาที่ผ่านมาว่า การพัฒนาผลิตภัณฑ์ AI ต้องอิงจากข้อเสนอแนะของผลิตภัณฑ์เพื่อกำหนดว่าโมเดลควรให้รางวัลหรือลงโทษอะไร คำตอบใดถือว่าดี และพฤติกรรมใดถือว่าไม่ดี ซึ่งหมายความว่า ทีมโมเดลและทีมผลิตภัณฑ์ต้องร่วมกันดำเนินกระบวนการแชร์บริบทเพื่อสร้าง Co-Design และร่วมกันสร้างประสบการณ์ที่ดียิ่งขึ้น

ดังนั้น ผลิตภัณฑ์ AI ควรเชื่อมต่อและสะสมข้อมูลบริบทจากหลายแหล่งบนฝั่งผู้ใช้ จากนั้นจึงระบุว่าข้อมูลใดควรให้และข้อมูลใดไม่ควรให้ เพื่อให้สอดคล้องกับเจตนาของงานกับเอเจนต์ ในฝั่งการพัฒนา ควรสร้างกลไกการให้ข้อมูลย้อนกลับอย่างราบรื่น เพื่อให้เป้าหมายการพัฒนาของทีมโมเดลและทีมผลิตภัณฑ์สอดคล้องกัน และเร่งการปรับปรุงประสบการณ์

การสะสมและแชร์บริบททั้งจากฝั่งผู้ใช้และฝั่งการพัฒนา ไม่ใช่เพียงปัญหาด้านการพัฒนา แต่ยังเป็นปัญหาด้านองค์กร ซึ่งต้องบรรลุผ่านการร่วมมือกัน

นี่จึงเป็นเหตุผลที่ OpenAI เริ่มจัดโครงสร้างทีมใหม่ตั้งแต่เดือนมกราคมปีนี้ เพื่อให้ทีมผลิตภัณฑ์และนักวิจัยที่รับผิดชอบโมเดลพื้นฐานที่เกี่ยวข้องทำงานร่วมกันอย่างใกล้ชิดยิ่งขึ้น จากนั้นจึงรวมทีม ChatGPT, Codex และ API เข้าเป็นหน่วยงานเดียว โดยมี Thibault Sottiaux เป็นผู้ดูแล

ในขณะเดียวกัน การให้ความสำคัญกับบริบทอาจยังกระตุ้นให้ฮาร์ดแวร์กลายเป็นเอเจนต์ ทำให้ฮาร์ดแวร์เป็นช่องทางที่มีประสิทธิภาพในการรวบรวมบริบทของผู้ใช้ โครงการ Project Solara ของไมโครซอฟท์กำลังดำเนินการสำรวจในทิศทางนี้ การสื่อสารอย่างต่อเนื่องทุกที่ทุกเวลาไม่ใช่เป้าหมายเดียวของการพัฒนาอุปกรณ์เดสก์ท็อปและอุปกรณ์พกพาสำหรับเอเจนต์ แต่เป้าหมายหลักคือการให้ข้อมูลบริบทเพิ่มเติมแก่เอเจนต์เพื่อให้สามารถดำเนินงานได้ในสถานการณ์เดสก์ท็อปและมือถือ

ในช่วงไม่กี่ปีที่ผ่านมา อุตสาหกรรม AI ได้แสดงเส้นทางเทคโนโลยีที่ค่อนข้างชัดเจน: การฝึกล่วงหน้า → การฝึกหลัง → Agent → Coding Agent เส้นทางนี้อาจไม่ใช่เส้นหลักเดียวในอนาคต แต่เป็นเส้นทางที่มีประสิทธิภาพที่สุดที่บริษัทขนาดใหญ่สามารถจับได้ในขณะนี้

แนวโน้มสี่ประการที่เราสกัดออกมาเป็นพิกัดพื้นฐานที่เชื่อมโยงกันอย่างต่อเนื่องในเส้นทางที่กำหนดไว้ โดยมีเป้าหมายสุดท้ายคือการขยายความสามารถของ Coding Agent ให้ใช้งานได้ในบริบททั่วไป นี่คือการแข่งขันระดับระบบอีกครั้ง

การแข่งขันของตัวแทนจากบริษัทเทคโนโลยีขนาดใหญ่พัฒนาไปตามทิศทางหลักสี่ประการ

เพื่อนร่วมงานกลายเป็นจุดแข่งขันหลักของตัวแทน

การบูรณาการและการเชื่อมต่อผลิตภัณฑ์ภายในกำลังลึกซึ้งยิ่งขึ้น

การสร้างระบบนิเวศภายนอกเริ่มถูกนำเข้าสู่วาระการประชุม

บริบทมีความสำคัญมากขึ้น