การทดสอบ PinchBench: Gemini 3 Flash นำหน้าโมเดล AI ด้วยอัตราความสำเร็จ 95.1% ในงาน OpenClaw

KuCoinFlash

เวลาเผยแพร่: 08/03/2569 03:46:00

แชร์

สรุป

สภาพคล่องและตลาดคริปโตได้เห็นมาตรฐานใหม่เมื่อ Gemini 3 Flash ทำลายสถิติในการทดสอบ PinchBench ด้วยอัตราความสำเร็จ 95.1% ในงาน OpenClaw ตามด้วย Minimax-m2.1 และ Kimi-k2.5 ที่ได้คะแนน 93.6% และ 93.4% ตามลำดับ ส่วน Claude Sonnet 4.5 และ GPT-4o ได้คะแนน 92.7% และ 85.2% การทดสอบเน้นที่ประสิทธิภาพของตัวแทนในโลกจริง หน่วยงานกำกับดูแลที่ติดตามการปฏิบัติตาม CFT อาจติดตามตัวชี้วัดเหล่านี้เพื่อความโปร่งใส

Odaily Planet Daily รายงานว่า 23pads หัวหน้าเจ้าหน้าที่ความปลอดภัยของ SlowMist ได้โพสต์บนแพลตฟอร์ม X ว่า การทดสอบมาตรฐาน PinchBench ประเมินประสิทธิภาพของโมเดลภาษาขนาดใหญ่ของ AI ในการดำเนินงานตัวแทน OpenClaw ผลการทดสอบแสดงให้เห็นว่า Gemini 3 Flash มีอัตราความสำเร็จในการจัดการงาน OpenClaw สูงสุดที่ 95.1% ตามด้วย minimax-m2.1 และ kimi-k2.5 ที่มีอัตราความสำเร็จตามลำดับที่ 93.6% และ 93.4% ส่วน Claude Sonnet 4.5 อยู่ที่ 92.7% และ GPT-4o อยู่ที่ 85.2%

แหล่งที่มา:แสดงต้นฉบับ

คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา