Google melancarkan aplikasi input suara eksperimen, Google AI Edge Eloquent, pada platform iOS pada 6 April, menonjolkan fungsi berjalan secara luar talian dan penyempernaan teks pintar. Aplikasi ini dilengkapi dengan model ASR Gemma4 buatan sendiri (spesifikasi E2B/E4B), menyokong penukaran suara ke teks secara tempatan, penyaringan automatik perkataan penghubung dan pengulangan, serta menyediakan empat gaya teks: ringkasan, rasmi, pendek, dan lengkap. Pengguna boleh memilih untuk mengaktifkan model Gemini awan untuk pembersihan mendalam, serta mengimport kenalan Gmail dan istilah untuk membina kamus peribadi. Aplikasi ini percuma tanpa sekatan langganan, berbeza ketara dengan pesaing SuperWhisper yang menuntut bayaran tahunan sebanyak USD85. Versi Android telah disenaraikan dalam rancangan pembangunan, dan akan menyokong integrasi papan kekunci sistem dan operasi terapung pada masa hadapan. Tindakan ini menandakan pelaksanaan nyata Google dalam bidang pemprosesan suara AI tepi, serta menonjolkan kemampuan teknikal model Gemma dalam pelaksanaan ringan di peranti mudah alih.
Penulis artikel, sumber: AIBase
Pada 6 April (Isnin) masa tempatan, Google melancarkan secara senyap sebuah aplikasi input suara eksperimen bernama “Google AI Edge Eloquent” di platform iOS. Aplikasi ini menonjolkan “utama luar talian” dan “penyempurnaan pintar”, bertujuan untuk memanfaatkan teknologi AI sisi tepi untuk mengubah ucapan semula jadi secara masa nyata menjadi teks profesional dan ringkas. Tindakan ini menandakan pengenalan rasmi Google ke dalam pasaran transkripsi suara AI tinggi yang dipimpin oleh Wispr Flow dan SuperWhisper.
Teknologi Inti dan Ciri-ciri Utama:
Eloquent dilengkapi dengan model pengenalan suara automatik (ASR) Gemma4 terbaharu daripada Google (spesifikasi E2B/E4B). Model ini menyokong operasi sepenuhnya tanpa sambungan internet; pengguna boleh melakukan transkripsi tempatan setelah memuat turun pakej model, memastikan privasi yang lebih baik dan mengurangkan latensi. Aplikasi ini mempunyai fungsi "pembersihan pintar" yang kuat, yang mampu mengenal pasti dan menyaring perkataan penghubung seperti "eh" dan "ah", serta pengulangan dan koreksi, untuk menghasilkan teks yang logik dan lancar.
Pengintegrasian dan interaksi produk yang mendalam:
- Penukaran gaya multimodal: Menyediakan empat mod pemprosesan teks: "Poin Utama", "Formal", "Ringkas", dan "Lengkap".
- Kolaborasi awan (pilihan): Selepas menghidupkan mod awan, aplikasi akan memanggil model Gemini awan untuk pembersihan teks mendalam.
- Konteks personalisasi: Menyokong import perkataan kunci, nama orang, dan istilah khas pengguna daripada Gmail, serta membenarkan pembinaan kamus tersuai.
- Statistik produktiviti: Menunjukkan bilangan perkataan yang ditulis secara langsung, kelajuan perkataan per minit (WPM), dan rekod sesi sebelumnya.
Strategi pasaran dan perancangan masa depan:
Aplikasi ini kini disediakan secara percuma di iOS App Store, tanpa yuran langganan atau sekatan penggunaan, memberikan kesan yang kuat berbanding pesaing seperti SuperWhisper yang menarik yuran tahunan sebanyak US$85. Walaupun dilancarkan terlebih dahulu di iOS, keterangan rasmi mengesahkan perancangan pembangunan versi Android, serta mengumumkan sokongan untuk integrasi papan kekunci sistem dan fungsi butang terapung serupa Wispr Flow. Sebagai ahli penting di bawah jenama Google AI Edge, pelancaran Eloquent bukan sahaja usaha dalam aplikasi alat, tetapi juga kes kesan Google dalam menunjukkan kemampuan model Gemma dalam pelaksanaan di peranti mudah alih.
