หัวข้อ: ตัวแทนเบราว์เซอร์แบบโอเพนซอร์สของ Microsoft ชื่อ Fara1.5 ทำผลงานเหนือ OpenAI และ Google — และออกแบบมาเพื่อทำงานภายใต้การควบคุมของคุณ ลองจินตนาการว่าคุณสั่ง AI ให้ค้นหาข้อมูลบนเว็บไซต์ท่องเที่ยวห้าแห่ง เปรียบเทียบตัวเลือก กรอกแบบฟอร์มการจอง และยืนยันที่พักที่ใกล้ชายหาดที่สุด — จากนั้นกลับมาพบว่างานเสร็จสมบูรณ์แล้ว นี่คือสิ่งที่ “ตัวแทนการใช้งานคอมพิวเตอร์” สัญญาไว้: โมเดลที่สามารถอ่านเบราว์เซอร์ของคุณ คลิก เลื่อน และพิมพ์เหมือนมนุษย์ จนถึงตอนนี้ ผู้นำในด้านนี้คือบริการคลาวด์แบบเอกสิทธิ์ที่มีราคาแพง: OpenAI’s Operator (ผลิตภัณฑ์ราคา $200/เดือน เปิดตัวในเดือนมกราคม 2025 ต่อมาถูกรวมเข้ากับ ChatGPT Agent) และ Google’s Gemini 2.5 Computer Use สัปดาห์นี้ Microsoft Research เปลี่ยนเกมด้วย Fara1.5 — ชุดโมเดลขนาดเล็กแบบโอเพนซอร์สที่ทำคะแนนเหนือทั้งสองรายในแบบทดสอบการท่องเว็บแบบเรียลไทม์ และเปิดเผยน้ำหนักโมเดลและโค้ดการประมวลผลให้สาธารณะ Fara1.5 คืออะไร - ชุดโมเดลสามตัว (4B, 9B, 27B พารามิเตอร์) สร้างขึ้นจากฐาน Qwen3.5 ของ Alibaba และปรับแต่งโดย Microsoft เพื่องานเบราว์เซอร์ (พารามิเตอร์บ่งชี้ความสามารถของโมเดลโดยคร่าวๆ; ยิ่งมากยิ่งมีศักยภาพสูง) - น้ำหนักโมเดลทั้งหมดถูกเปิดเผยอย่างเปิดเผย และโค้ดการประมวลผลอยู่บน GitHub ดังนั้นคุณสามารถรันตัวแทนบนฮาร์ดแวร์ที่คุณควบคุมได้ โดยไม่ต้องพึ่งผู้ให้บริการคลาวด์ ประสิทธิภาพของมัน (แบบทดสอบเว็บจริง) Microsoft มุ่งเป้าไปที่แบบทดสอบ Online-Mind2Web — งานจริง 300 งานบนเว็บไซต์สด 136 แห่ง (เปรียบเทียบผลิตภัณฑ์ กรอกแบบฟอร์ม การจอง) โดยวัดจากความสำเร็จบนเว็บที่เปลี่ยนแปลงอยู่เสมอ: - Fara1.5-27B: 72.0% - OpenAI Operator: 58.3% - Google Gemini 2.5 Computer Use: 57.3% - Yutori Navigator n1 (คู่แข่งเอกสิทธิ์อันดับหนึ่ง): 64.7% - Fara1.5-9B: 63.4% (เหนือกว่า OpenAI และ Google แล้ว) คู่แข่งแบบโอเพนซอร์สตามหลัง: GUI-Owl-1.5 (8B) ของ Alibaba 48.6%; MolmoWeb ของ AI2 35.3%; Fara-7B เวอร์ชันเก่าของ Microsoft 34.1% (ดังนั้นเวอร์ชันใหม่นี้เพิ่มคะแนนเกือบสองเท่าจากโมเดลก่อนหน้า) ใน WebVoyager แบบทดสอบเว็บสดอีกชุดหนึ่ง Fara1.5-27B ได้คะแนน 88.6% (เมื่อเทียบกับ OpenAI Operator ที่ 87.0% และ H Company’s Holo2-30B ที่ 83.0%) เหตุใดจึงชนะ Microsoft สร้างกระบวนการพัฒนาใหม่ทั้งหมดตั้งแต่ต้นจนจบ โดยองค์ประกอบสำคัญ: - FaraGen1.5: ระบบสร้างข้อมูลเฉพาะตัวที่ใช้ GPT-5.4 (โมเดลผู้สอนของ OpenAI) เพื่อสร้างตัวอย่างคุณภาพสูงสำหรับฝึกฝน Fara1.5 — โดยสรุป Microsoft ใช้โมเดลชั้นนำของ OpenAI เป็นผู้สอนเพื่อฝึกฝนคู่แข่งแบบโอเพนซอร์ส - การฝึกอบรมในโดเมนจำลอง: เว็บไซต์จำลองหกแห่งที่ทำงานได้จริง (อีเมล ปฏิทิน ตลาด) ช่วยให้โมเดลซ้อมกระบวนการที่ละเอียดอ่อนหรือไม่สามารถย้อนกลับได้ (การเข้าสู่ระบบ การจอง การส่งอีเมล) โดยไม่ต้องเชื่อมต่อกับบัญชีจริง - เป้าหมายและการประสานงานที่ออกแบบใหม่: ข้อมูล เป้าหมายการฝึกอบรม สถาปัตยกรรมโมเดล และการประสานงานแบบเรียลไทม์ถูกปรับให้เหมาะสมร่วมกัน เพื่อให้มodelขนาดเล็กมีความแข็งแกร่งในการทำงานแบบ “agentic” ความปลอดภัยและการควบคุม Microsoft เน้นมาตรการป้องกันเป็นพิเศษ โมเดลถูกออกแบบให้หยุดและขอการยืนยันก่อนดำเนินการที่ไม่สามารถย้อนกลับได้ มีชั้นอินเทอร์เฟซ (Magnetic-UI) และสภาพแวดล้อมเบราว์เซอร์แบบแยกส่วน (MagneticLite) ที่บันทึกการกระทำทุกอย่างและอนุญาตให้ผู้ใช้หยุดตัวแทนได้ทุกเมื่อ เช่นเดียวกับที่ Yash Lara จาก Microsoft กล่าวว่า การสมดุลระหว่างจุดตรวจสอบที่เข้มงวดกับประสบการณ์ผู้ใช้ที่ราบรื่นเป็นสิ่งสำคัญเพื่อหลีกเลี่ยงความเหนื่อยล้าจากการอนุมัติ ในขณะเดียวกันก็รักษาความปลอดภัยให้ผู้ใช้ ซึ่งแตกต่างจากคำเตือนก่อนหน้านี้จาก OpenAI เกี่ยวกับตัวแทนที่เข้าถึงข้อมูลสำคัญเมื่อเข้าสู่ระบบบริการ; มาตรการของ Microsoft เน้นการแยกส่วนและบันทึกอย่างชัดเจน เหตุใดคนในวงการคริปโตควรสนใจ - น้ำหนักเปิด + การประมวลผลบนเครื่องตนเอง = การควบคุมตนเอง การรันโมเดลแบบ agentic บนโครงสร้างพื้นฐานที่ควบคุมได้สอดคล้องกับหลักการของคริปโตเกี่ยวกับการจัดเก็บและการกระจายอำนาจ (เช่น บอทโฮสต์เองที่สามารถโต้ตอบกับ DApp, exchange หรือเครื่องมือ DAO โดยไม่ต้องเปิดเผยกุญแจให้คลาวด์ภายนอก) - พฤติกรรมสามารถตรวจสอบได้: เอกสารบันทึกจากสภาพแวดล้อมแยกส่วนและโค้ดสาธารณะทำให้ง่ายต่อการตรวจสอบและพัฒนาโดยผู้ตรวจสอบและนักพัฒนา เพื่อยืนยันพฤติกรรมของตัวแทนและรวมมาตรการป้องกันเข้ากับกระบวนการสัญญาอัจฉริยะ - สภาพแวดล้อมการแข่งขัน: การมีตัวแทนโอเพนซอร์สที่มีประสิทธิภาพสูงลดความเสี่ยงจากการผูกขาด API จากคลาวด์รายใหญ่ และอาจเร่งการพัฒนาเครื่องมือที่รวมตัวแทน AI เข้ากับระบบบนโซ่ ความพร้อมใช้งานและขั้นตอนถัดไป - Fara1.5-9B มีให้ใช้งานแล้วบน Azure AI Foundry; เวอร์ชัน 4B และ 27B จะมาถึงในเร็วๆ นี้ - Microsoft มีแผนขยาย Fara1.5Beyond เบราว์เซอร์ไปยังซอฟต์แวร์บนเดสก์ท็อปและองค์กร สรุป Fara1.5 เป็นจุดเปลี่ยนครั้งสำคัญ: ตัวแทนเบราว์เซอร์ที่เปิดเผยสาธารณะ มีประสิทธิภาพแข่งขันได้ และทำคะแนนเหนือทางเลือกแบบเอกสิทธิ์ในแบบทดสอบเว็บจริง ในขณะเดียวกันก็มอบการควบคุมและความโปร่งใสที่สำคัญสำหรับชุมชนที่ใส่ใจความเป็นส่วนตัวและการกระจายอำนาจ หากคุณสนใจรันตัวแทนที่มีความสามารถบนโครงสร้างของคุณเอง — ไม่ว่าจะเป็นผู้ช่วยเทรดอัตโนมัติหรือผู้ช่วย DAO — สิ่งนี้สมควรได้รับความสนใจ
Fara1.5 ของ Microsoft ทำผลงานเหนือ OpenAI และ Google ในแบบทดสอบการท่องเว็บ
ChainGPTแชร์






ข่าวบนโซ่แตกเมื่อ Microsoft Research เปิดตัว Fara1.5 ตัวแทนเบราว์เซอร์ที่ทำผลงานเหนือ OpenAI และ Google ในแบบทดสอบเว็บ สร้างขึ้นบน Qwen3.5 Fara1.5-27B ได้คะแนน 72.0% บน Online-Mind2Web และ 88.6% บน WebVoyager โมเดลนี้มีเวอร์ชัน 4B, 9B และ 27B โดยน้ำหนักและโค้ดได้รับการเปิดแหล่งที่มาแล้ว คุณสมบัติด้านความปลอดภัย เช่น การท่องเว็บในสภาพแวดล้อมแยกตัว สอดคล้องกับแนวโน้มข่าวเกี่ยวกับสินทรัพย์จริง (RWA) Fara1.5-9B พร้อมใช้งานแล้วบน Azure AI Foundry และเวอร์ชันอื่นๆ จะตามมาเร็วๆ นี้
แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้
การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา