Thinking Machines Lab เปิดตัวตัวอย่างโมเดล AI แบบอินเตอร์แอคทีฟแบบเรียลไทม์

icon币界网
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
Thinking Machines Lab ซึ่งก่อตั้งโดยอดีตหัวหน้าเทคโนโลยีของ OpenAI คือ Mira Murati ได้เปิดเผยตัวอย่างการวิจัยของ 'Interactive Model' สำหรับการโต้ตอบด้วยปัญญาประดิษฐ์เสียงแบบเรียลไทม์ โมเดลนี้สามารถรับและส่งข้อมูลพร้อมกัน ทำให้เลียนแบบการสนทนาตามธรรมชาติ TML-Interaction-Small ตอบกลับในเวลาประมาณ 0.40 วินาที—เร็วกว่าโมเดลบางตัวจาก OpenAI และ Google เทคโนโลยีนี้ยังอยู่ในขั้นตอนตัวอย่างการวิจัย แต่อาจเชื่อมโยงกับข่าวสารเกี่ยวกับทรัพย์สินจริง (RWA) หากมีการขยายขอบเขตในอนาคต คาดว่าจะเปิดให้ผู้ใช้ทั่วไปเข้าถึงได้ในช่วงปลายปีนี้
CoinDesk รายงาน:

Thinking Machines Lab ซึ่งก่อตั้งโดย Mira Murati อดีตหัวหน้าเทคโนโลยีของ OpenAI ได้เปิดเผยการทดลองล่วงหน้าของโมเดลที่เรียกว่า "Interactive Models" เพื่อเปลี่ยนวิธีการทำงานของ AI เสียงแบบตอบคำถามแบบเดิมๆ บริษัทระบุว่า โมเดลเหล่านี้สามารถสร้างคำตอบขณะรับข้อมูลจากผู้ใช้ ทำให้การสนทนาใกล้เคียงกับการพูดคุยทางโทรศัพท์มากกว่าการส่งข้อความสลับกัน

เปลี่ยนวิธีการตอบกลับให้เป็นแบบซิงโครนัส

วิธีการโต้ตอบของโมเดล AI ส่วนใหญ่ในปัจจุบันค่อนข้างคงที่: ผู้ใช้พูดเสร็จแล้วโมเดลจึงเริ่มประมวลผลและตอบกลับ Thinking Machines ต้องการรวมกระบวนการ “ฟัง” และ “พูด” เข้าด้วยกัน เพื่อให้โมเดลสามารถเข้าใจบริบทอย่างต่อเนื่องและเตรียมคำตอบขณะที่การสนทนายังไม่สิ้นสุด

บริษัทอธิบายเทคโนโลยีนี้ว่าเป็น “ฟูลดูเพล็กซ์” ตามที่ระบุ รุ่นทดลองแรก TML-Interaction-Small มีเวลาตอบสนองประมาณ 0.40 วินาที ใกล้เคียงกับความเร็วของการพูดคุยของมนุษย์ตามธรรมชาติ และเร็วกว่าโมเดลประเภทเดียวกันบางรุ่นของ OpenAI และ Google ที่กล่าวถึงในบทความ

ยังอยู่ในระยะการตรวจสอบแบบเริ่มต้น

อย่างไรก็ตาม ความสามารถนี้ยังไม่ได้เปิดให้ใช้งานอย่างเป็นทางการสำหรับสาธารณะ Thinking Machines ระบุว่าในขั้นตอนนี้ได้เปิดตัวเวอร์ชันทดลองวิจัยเท่านั้น และยังไม่รองรับการใช้งานแบบเปิดเผย

ตามตารางเวลาที่บริษัทเปิดเผย ช่วงหลายเดือนข้างหน้าจะเริ่มเปิดให้ใช้งานแบบจำกัดก่อน แล้วจึงมุ่งเป้าขยายขอบเขตการเข้าถึงในช่วงปลายปีนี้

ประสบการณ์จริงยังต้องรอการยืนยัน

จากข้อมูลที่เปิดเผย แนวทางนี้มุ่งเน้นไม่เพียงแค่ลดความล่าช้า แต่ยังรวมถึงการรวมความสามารถในการโต้ตอบเข้าไปในตัวโมเดลโดยตรง แทนที่จะเพิ่มกระบวนการประมวลผลเสียงไว้ภายนอกโมเดล หากแนวคิดนี้ใช้ได้จริง วิธีการใช้งานผู้ช่วยเสียง การร่วมมือแบบเรียลไทม์ และผลิตภัณฑ์ AI แบบสนทนาอาจเปลี่ยนไป

อย่างไรก็ตาม ในขั้นตอนปัจจุบัน สิ่งที่ภายนอกสามารถมองเห็นได้ยังคงเป็นคำอธิบายทางเทคนิคและผลลัพธ์มาตรฐานที่บริษัทให้มา เนื่องจากผลิตภัณฑ์ยังไม่เปิดให้ใช้งาน ความเสถียรในสถานการณ์จริง ประสิทธิภาพในการจัดการกับการขัดจังหวะ และประสบการณ์การสนทนาโดยรวม ยังต้องรอให้ผู้ใช้งานทดสอบจริงก่อนจึงจะสามารถประเมินเพิ่มเติมได้

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา