動察 Beating の監視によると、アリババのQwenチームは、アリババクラウドのBailianプラットフォームで、自社のフラッグシップモデルQwen3.7-Maxのデフォルト設定に自動暗黙的キャッシュを導入したと発表しました。開発者はコードを変更したり追加のパラメータを指定したりする必要なく、キャッシュによるコスト削減を即座に利用できます。 新たな課金メカニズムでは、システムがリクエスト内の重複するコンテキストプレフィックスを自動的に認識・抽出します。キャッシュヒットが発生した場合、ヒットした部分の入力トークン料金は従来価格の20%のみが課金され、入力コストの80%が直接免除されます。 この暗黙的キャッシュは、長文およびAgentエージェントシナリオにおける大幅なコスト増加に直接対応しています。100万トークンのコンテキストウィンドウを備えるQwen3.7-Maxは、自律的なコーディングなどの高度なタスクを実行する際、大規模なコードベースや知識ドキュメントを頻繁に繰り返し読み込む必要があります。ある開発者がQwen3.7をテストしたところ、たった1時間未満で「戦車大戦」のWebデモを構築するだけで、ほぼ100万トークンを消費しました。もしエージェントにバックグラウンドでコードレビューと繰り返しイテレーションを自動実行させると、1日あたりの使用量は簡単に数億トークンに達します。 キャッシュ価格における競合他社の価格競争は、アリババが値下げを決定したもう一つの直接的な要因です。以前、DeepSeek V4-Proは極めて低いキャッシュヒット価格で多くの開発者を引き付けました。5月末に永久値下げを発表後、DeepSeek V4-Proのキャッシュヒット課金は、100万トークンあたり0.003625米ドル(約人民元0.025元)に引き下げられ、標準入力価格に対して99.17%のコスト削減を実現しました。多くの開発者がReasonixなどの専用ツールと組み合わせて、1回のセッションにおけるキャッシュヒット率を最大99%という限界まで引き上げ、長時間セッションのエージェント実行コストをほぼゼロに抑えています。 競合の圧力に対応して、Qwen3.7-Maxは設定不要の暗黙的キャッシュを導入するだけでなく、cache_control識別子を手動で宣言する必要がある明示的キャッシュモードも維持しています。自動キャッシュと比較して、明示的キャッシュはヒット確定性が高く、ヒット料金は標準入力単価の10%(1割)まで低下しますが、最初にキャッシュを作成する際には125%のプレミアムが課され、キャッシュブロックのライフサイクルは5分間(ヒットごとにリセット可能)です。
Aliyun、Qwen3.7-Maxに暗黙的キャッシュを導入し、入力コストを最大80%削減
MarsBit共有






AliyunがQwen3.7-Maxに暗黙的キャッシュを導入し、入力コストを最大80%削減。このアップデートはBaiLianで既に適用されており、コード変更は不要です。キャッシュヒット時のコストは入力トークンの20%となり、長文やエージェントワークフローに最適です。新規トークンのリストリングはこの効率向上の恩恵を受ける可能性があります。同モデルは明示的キャッシュを10%でサポートしていますが、手動設定が必要です。暗号資産価格のニュースでは、このようなコスト削減を目的としたイノベーションがしばしば注目されます。
出典:原文を表示
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。
デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。