クアルコムCEO、2030年までに10秒あたり1.27兆のAIトークンが生成されると予測

クアルコムのCEO、クリスティアーノ・アモンは、AIエンジンの加速速度について具体的な数値を示した。台北で開催されたCOMPUTEX 2026の基調講演で、アモンは2030年までにAIトークン生成が10秒あたり1.27兆トークンに達すると予測し、これは現在の10秒あたり約317億トークンと比較して約40倍の増加となる。

明確にしておきます：これらは暗号通貨トークンではありません。これらは、大規模言語モデルがクエリに応答するたびに生成するテキスト、コード、推論の基本単位であるAI推論トークンです。この違いは、このような膨大なボリュームを処理するために必要なインフラが、チップメーカー、クラウドプロバイダー、およびAIに依存する製品を開発するすべての者に大きな影響を及ぼすため、重要です。

自律への答えから

今日のAIモデルは主に回答を生成します。質問をすれば、数百トークン程度の応答が得られます。しかし、これから登場するのは異なります。単に回答するだけでなく、自律的に意思決定と行動を実行するエージェント型AIは、はるかに多くのトークンスループットを必要とするでしょう。

アモンは、これを遠い将来の可能性ではなく、半導体産業が今すぐ解決すべきインフラ課題として位置付けた。

クアルコムのエッジコンピューティングへの賭け

10秒ごとに1.27兆個のトークンが生成される場合、それらすべてを中央集権的なクラウドデータセンターを通じて処理すると、費用が莫大になり、処理速度も著しく遅くなります。Amonの解決策：可能な限り多くのAI処理をデバイス自体に移行することです。QualcommのSnapdragonプラットフォームは、すべてのリクエストをサーバーファームに送信するのではなく、スマートフォン、PC、ウェアラブルデバイス、車両などでローカルに推論ワークロードを処理するように設計されています。

デモでは、Qualcommがハイブリッドエッジ・クラウド戦略によりトークン使用量を最大60%削減し、コストを4分の1に削減できることを示しました。AIの推論の大部分があなたの携帯電話やラップトップで行われる場合、システムは本当に難しいタスクのみにクラウドを呼び出す必要があります。

これは投資家にとって何を意味するのか

エッジAI処理は、異なる勝者を持つ別の市場である。クアルコムはモバイルシステムオンチップ設計を支配している。もし将来、すべてのスマートフォン、すべてのPC、すべての車、すべてのウェアラブルデバイスでAI推論が求められるのであれば、これは同社の複数の製品ラインにわたるコア事業にとって長期的な追い風となる。

投資家は、アモンが言及しなかった点にも注意すべきです。彼の基調講演では、「トークン」という用語が混乱を招くにもかかわらず、ブロックチェーン技術や仮想通貨については一切言及されていません。1.27兆という数字は、デジタル資産ではなく、AI計算トークンを完全に指しています。