ME News 消息,4 月 18 日(UTC+8),xAI 近日宣布正式推出 Grok 語音轉文字(STT)和 Grok 文字轉語音(TTS)兩款獨立的音頻 API。Grok STT 提供高準確率、低延遲的轉錄服務,支援 REST API 批量處理和 WebSocket API 實時流式轉錄,並具備詞級時間戳、說話人分離、多聲道支援及智能逆文字規範化功能。文中提及,在電話通話、會議、視頻/播客等多個領域的基準測試中,其詞錯誤率表現優於 ElevenLabs、Deepgram 和 AssemblyAI 等主流商業模型。該服務支援超過 25 種語言,定價為批量處理每小時 0.10 美元,流式處理每小時 0.20 美元。Grok TTS 則可生成快速、自然且富有表現力的語音,支援透過簡單語音標籤進行細粒度控制,定價為每 100 萬個字符 4.20 美元。兩款 API 基於為 Grok Voice、特斯拉車輛和 Starlink 客戶支援提供動力的相同技術棧。(來源:InFoQ)
xAI 推出 Grok STT 和 TTS API,具備競爭性定價與多語言支援
KuCoinFlash分享






xAI 已推出 Grok STT 和 TTS API,具備競爭性定價與多語言支援。Grok STT 提供高準確率的轉錄功能,支援批次與串流模式,在詞語錯誤率上優於主要競爭對手,支援超過 25 種語言,批次轉錄每小時收費 $0.10,串流轉錄每小時收費 $0.20。Grok TTS 提供生動語音,每百萬字元收費 $4.20。這些 API 用於支援 Grok Voice、Tesla 和 Starlink。隨著新代幣上線數量增加,開發者與交易員正密切關注利率新聞以掌握市場動向。
來源:顯示原文
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款和風險披露 。