Thinking Machines Lab, yang didirikan oleh Mira Murati, bekas Chief Technology Officer OpenAI, telah mengumumkan pra-pandangan penelitian bernama "Interactive Model" yang berusaha mengubah cara kerja AI suara semasa ini yang berdasarkan soal-jawab. Syarikat tersebut menyatakan bahawa model semacam ini boleh menghasilkan respons sambil menerima input pengguna, menjadikan perbualan lebih menyerupai panggilan telefon daripada penghantaran mesej bergilir-gilir.
Ubah cara respons kepada secara serentak
Kebanyakan model AI semasa ini mempunyai cara interaksi yang cukup tetap: pengguna selesai berbicara, kemudian model baru memulakan pemprosesan dan menjawab. Thinking Machines ingin menggabungkan proses "mendengar" dan "berbicara" menjadi satu, supaya model boleh memahami konteks secara berterusan dan bersedia menjawab sebelum perbualan berakhir.
Perusahaan menggambarkan teknologi ini sebagai "dua arah penuh". Menurut mereka, model pertama, TML-Interaction-Small, mempunyai masa respons sekitar 0.40 saat, yang hampir sepadan dengan kelajuan perbualan manusia semula jadi, serta lebih pantas daripada beberapa model sejenis OpenAI dan Google yang disebut dalam kertas itu.
Masih dalam pra-pandangan penyelidikan
Namun, kemampuan ini belum merupakan produk rasmi yang dibuka kepada awam. Thinking Machines menyatakan bahawa versi pra-pelancaran kajian ini dikeluarkan pada peringkat ini dan tidak tersedia untuk penggunaan awam.
Menurut jadual yang dinyatakan oleh syarikat, versi pra-pelajaran terhad akan dilancarkan dalam beberapa bulan mendatang, diikuti dengan usaha untuk memperluaskan lingkungan akses pada akhir tahun ini.
Pengalaman sebenar masih perlu diverifikasi
Dari maklumat yang telah diumumkan, fokus arah ini bukan sahaja mengurangkan latensi, tetapi juga mengintegrasikan kemampuan interaktif secara langsung ke dalam model, bukan menambahkan proses pemprosesan suara di luar model. Jika pendekatan ini berjaya, cara penggunaan pembantu suara, kolaborasi masa nyata, dan produk AI perbualan mungkin berubah.
Namun, pada peringkat ini, apa yang dapat dilihat oleh pihak luar masih terutama mengenai perihal teknikal dan keputusan rujukan yang diberikan oleh syarikat. Oleh kerana produk belum dibuka, kestabilan dalam skenario sebenar, kesan penanganan gangguan, serta pengalaman perbualan keseluruhan masih perlu ditentukan selepas pengguna melakukan ujian sebenar.
