海外メディアによると、中国の先端モデルベンダーは最近、API価格をさらに引き下げており、DeepSeekと小米が次々と新しい価格設定を発表した一方、米国の主要ラボの新モデルは単価の引き上げに向かっている。これにより、米中先端モデル間の推論コストの差はさらに拡大している。
企業顧客にとって、モデルの価格はトークン単位で課金されるAPIコストに主に反映されます。アプリケーションがモデルに接続された後、入力、出力、およびキャッシュヒットがすべて費用を発生させるため、単価の変動はAI製品の商業的実行可能性に直接影響します。
DeepSeekと小米が同時に価格引き下げ
DeepSeekは5月22日、V4-Proの以前の75%割引を長期価格に変更しました。調整後、このモデルの入力価格は100万トークンあたり0.435ドル、出力価格は0.87ドルです。
小米は5月26日、MiMo-V2.5 APIの価格を引き下げ、Pro版のキャッシュヒット入力価格を100万トークンあたり0.0036ドルに引き下げ、一部のプロジェクトでは最大99%の値下げとなった。小米の新しいプランによると、同じ価格で得られるトークン数は5倍から8倍に増加する。
価格引き下げの背後には推論の最適化があります
記事によると、この価格引き下げは単なるマーケティングアクションではない。小米MiMoチームの責任者で、かつてDeepSeekのコア開発者だった羅福莉は、主なコスト削減がキャッシュと推論フレームワークの最適化によるものだと述べた。システムはより多くの既処理情報を再利用し、重複計算を削減することで、ストレージと推論のコストを削減できる。
その説明によると、関連する最適化によりキャッシュトークンの処理能力が大幅に向上し、全体的なストレージおよび処理コストは約80%低下しました。新しいAPI価格のもとで、本番環境の推論エンジンがほぼ最大負荷で動作しても、依然として損益分岐点を維持できます。
DeepSeekは、モデルアーキテクチャを通じてコンテキスト計算コストを圧縮するアプローチを採用している。記事によると、V4は2種類の交差アテンションメカニズムを採用し、長コンテキストシナリオでKVキャッシュの規模を大幅に縮小し、1トークンの推論コストを削減している。百万トークンのコンテキスト計算において、V4-ProのKVキャッシュは前世代の約10%に過ぎず、1トークンの推論コストは前世代の約27%である。
アメリカのモデル価格は逆方向に動いています
記事によると、米国の主要モデルは最近、価格引き下げに追随していない。OpenAIは4月下旬に発表したGPT-5.5で、出力価格を100万トークンあたり30ドルに引き上げ、前世代の約2倍となった。AnthropicのClaude Opus 4.7の価格は据え置きだが、トークナイザーの更新により、同じテキストでより多くのトークンが生成される可能性があり、実際の請求額は最大で約35%増加する可能性がある。
対照的に、DeepSeek V4-Pro はコードベンチマーク SWE-Verified で 80.6% のスコアを記録し、Claude Opus 4.6 の 80.8% に近い水準ですが、出力価格の差は数十倍に及びます。小米 MiMo-V2.5-Pro は最新の価格改定後、DeepSeek V4-Pro と同様の入力および出力価格を実現しました。
記事では、DeepSeekや小米の他、MiniMax、Moonshot AI、Z.AIなどの中国のモデルベンダーも低価格を維持していると述べられている。記事の比較によると、2026年第二四半期には、中国と米国の最先端モデルの価格差はおおむね15倍から30倍の範囲にある。キャッシュバック割引を含めると、この差はさらに拡大する。
