Boson AI 與 LMSYS 基於 SGLang-Omni 推出 Higgs Audio v3 TTS 服務

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Boson AI 與 LMSYS 基於 SGLang-Omni 推出了 Higgs Audio v3 TTS 服務,提供 4B 參數與 100 種語言支援。該模型可透過文字標籤實現即時情緒、風格與語調控制,並支援串流合成與低延遲推論。此 AI + 加密貨幣新聞標誌著區塊鏈新聞與先進語音技術整合的進步。開發者現可使用零樣本克隆與輕量級運算功能。
ME AI 消息,Boson AI 與 LMSYS 聯合推出基於 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服務。該模型約 4B 參數,基於 Qwen3-4B 骨幹,支援 100 種語言(內部評測覆蓋 111 種),在 Seed-TTS、CV3、MiniMax-Multilingual 及 Higgs-Multilingual 零樣本語音克隆任務中達到單字級 WER/CER。開發者可透過文本內控制標籤實時調整情感(20+ 種)、風格、韻律(語速/音高/停頓)及音效。模型支援流式合成,文本未完整時即可開始生成語音並保持一致性。SGLang-Omni 專為多階段生成模型設計,統一調度 AR 解碼與輕量計算,實現低延遲推理。(來源:AiHot)
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露