xAI、Grok STTおよびTTS APIをリリースし、競争力のある価格設定と多言語対応を実現

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
xAIは、競争力のある価格設定と多言語対応を備えたGrok STTおよびTTS APIをリリースしました。Grok STTは、バッチおよびストリーミングオプションを備えた高精度な音声文字変換を提供し、単語誤り率で主要な競合他社を上回っています。バッチ処理は1時間あたり$0.10、ストリーミングは$0.20で、25以上の言語をサポートしています。Grok TTSは、100万文字あたり$4.20で表現力豊かな音声を提供します。これらのAPIは、Grok Voice、Tesla、Starlinkを駆動しています。新規トークンの上場が増加する中、開発者やトレーダーは市場の動向を踏まえ、金利ニュースに注目しています。

MEニュースによると、4月18日(UTC+8)、xAIはGrok音声からテキストへの変換(STT)およびGrokテキストから音声への変換(TTS)の2つの独立したオーディオAPIを正式にリリースしました。Grok STTは、高精度・低遅延の音声認識サービスを提供し、REST APIによるバッチ処理とWebSocket APIによるリアルタイムストリーミング転記をサポートしています。また、単語レベルのタイムスタンプ、話者分離、マルチチャンネル対応、インテリジェントな逆テキスト正規化機能を備えています。記事では、電話通話、会議、動画/ポッドキャストなどの複数の分野でのベンチマークテストにおいて、Grok STTの単語誤り率がElevenLabs、Deepgram、AssemblyAIなどの主要な商用モデルを上回っていると述べられています。このサービスは25種類以上の言語をサポートし、バッチ処理は1時間あたり0.10ドル、ストリーミング処理は1時間あたり0.20ドルで提供されています。Grok TTSは高速で自然かつ表現豊かな音声を生成でき、シンプルな音声タグを用いて細かい制御が可能で、100万文字あたり4.20ドルの料金です。これらのAPIは、Grok Voice、Tesla車両、Starlinkのカスタマーサポートを支える同じ技術スタックに基づいています。(出典:InFoQ)

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。