Thinking Machines Lab ซึ่งก่อตั้งโดย Mira Murati อดีตหัวหน้าเทคโนโลยีของ OpenAI ได้เปิดเผยการทดลองล่วงหน้าของโมเดลที่เรียกว่า "Interactive Models" เพื่อเปลี่ยนวิธีการทำงานของ AI เสียงแบบตอบคำถามแบบเดิมๆ บริษัทระบุว่า โมเดลเหล่านี้สามารถสร้างคำตอบขณะรับข้อมูลจากผู้ใช้ ทำให้การสนทนาใกล้เคียงกับการพูดคุยทางโทรศัพท์มากกว่าการส่งข้อความสลับกัน
เปลี่ยนวิธีการตอบกลับให้เป็นแบบซิงโครนัส
วิธีการโต้ตอบของโมเดล AI ส่วนใหญ่ในปัจจุบันค่อนข้างคงที่: ผู้ใช้พูดเสร็จแล้วโมเดลจึงเริ่มประมวลผลและตอบกลับ Thinking Machines ต้องการรวมกระบวนการ “ฟัง” และ “พูด” เข้าด้วยกัน เพื่อให้โมเดลสามารถเข้าใจบริบทอย่างต่อเนื่องและเตรียมคำตอบขณะที่การสนทนายังไม่สิ้นสุด
บริษัทอธิบายเทคโนโลยีนี้ว่าเป็น “ฟูลดูเพล็กซ์” ตามที่ระบุ รุ่นทดลองแรก TML-Interaction-Small มีเวลาตอบสนองประมาณ 0.40 วินาที ใกล้เคียงกับความเร็วของการพูดคุยของมนุษย์ตามธรรมชาติ และเร็วกว่าโมเดลประเภทเดียวกันบางรุ่นของ OpenAI และ Google ที่กล่าวถึงในบทความ
ยังอยู่ในระยะการตรวจสอบแบบเริ่มต้น
อย่างไรก็ตาม ความสามารถนี้ยังไม่ได้เปิดให้ใช้งานอย่างเป็นทางการสำหรับสาธารณะ Thinking Machines ระบุว่าในขั้นตอนนี้ได้เปิดตัวเวอร์ชันทดลองวิจัยเท่านั้น และยังไม่รองรับการใช้งานแบบเปิดเผย
ตามตารางเวลาที่บริษัทเปิดเผย ช่วงหลายเดือนข้างหน้าจะเริ่มเปิดให้ใช้งานแบบจำกัดก่อน แล้วจึงมุ่งเป้าขยายขอบเขตการเข้าถึงในช่วงปลายปีนี้
ประสบการณ์จริงยังต้องรอการยืนยัน
จากข้อมูลที่เปิดเผย แนวทางนี้มุ่งเน้นไม่เพียงแค่ลดความล่าช้า แต่ยังรวมถึงการรวมความสามารถในการโต้ตอบเข้าไปในตัวโมเดลโดยตรง แทนที่จะเพิ่มกระบวนการประมวลผลเสียงไว้ภายนอกโมเดล หากแนวคิดนี้ใช้ได้จริง วิธีการใช้งานผู้ช่วยเสียง การร่วมมือแบบเรียลไทม์ และผลิตภัณฑ์ AI แบบสนทนาอาจเปลี่ยนไป
อย่างไรก็ตาม ในขั้นตอนปัจจุบัน สิ่งที่ภายนอกสามารถมองเห็นได้ยังคงเป็นคำอธิบายทางเทคนิคและผลลัพธ์มาตรฐานที่บริษัทให้มา เนื่องจากผลิตภัณฑ์ยังไม่เปิดให้ใช้งาน ความเสถียรในสถานการณ์จริง ประสิทธิภาพในการจัดการกับการขัดจังหวะ และประสบการณ์การสนทนาโดยรวม ยังต้องรอให้ผู้ใช้งานทดสอบจริงก่อนจึงจะสามารถประเมินเพิ่มเติมได้
