数日前、OpenAIは新しい大規模モデルGPT-5.4-Cyberを正式にリリースしました。多くのネットユーザーの感想と同じく、このモデルも私たちに非常に強いデジャブ感をもたらしました。
この新モデルは、ターゲットユーザー層、適用シーン、さらにはマーケティング戦略において、Anthropicが数日前に発表したClaude Mythosとほぼ完全に一致している。このような「密接な競合」の姿勢は、もはや隠す気もない。『ニューヨーク・タイムズ』は最新の報道タイトルで、はっきりと「Anthropicと同様、OpenAI……」と指摘している。

この同質化の傾向は、最下層のベースモデルにとどまらない。両社が最近発表した一連の製品に目を向ければ、それらが互いの鏡像となっていることがわかる!
資本市場の無影灯の下で、この収束はより明確である。現在、両社の二次市場での評価額は非常に接近しており、Anthropicは企業市場での急成長を背景に、最近ではOpenAIをわずかに上回っている。資本の嗅覚は最も鋭く、彼らの目には、この2つのユニコーンが同じ角を生やしつつあるように見える。

底层大モデルの同質化は、上層アプリケーションの趨同を必然的に招くようだ。
今日、私は現代のAI補助プログラミングの最高水準を象徴する2つの指標的なツール、OpenAIのCodexとAnthropicのClaude Codeについて皆さんと考察したいと思います。かつては別々の道を歩んでいたこれらが、どのようにして次第に同じ姿へと成長していったのでしょうか?
別れ道から同じ目的地へ:二大勢力の進化史
数年前に時間を戻すと、Codex と Claude Code はまったく異なる技術哲学の産物だった。
Codexの基本ロジックは「天下の武功、唯だ速やかなるに破る」です。これは、あなたの後ろについていて、いつでもコードを補完してくれる5年経験の上級開発者のようなものです。

OpenAIの構想において、Codexは軽量で高インタラクティブなターミナルエージェントであり、高速な反復と対話型プログラミングを特徴としています。Cerebras WSE-3ハードウェアの支援により、毎秒1000トークンのスループットを実現します。具体的なワークフローでは、Codexは提案、自動編集、完全自動の3つの明確な承認モードを提供し、開発者が常にループ内に留まるようにします。この設計思想は、プロトタイプを迅速に構築し、高頻度のインタラクションを処理する必要があるハッカーや開発者に非常に適しています。
一方で、Claude Codeは誕生時から、冷たく控えめな「アーキテクト」の属性を備えている。

Anthropicは、極めて複雑なタスクを処理するための遺伝子を注入しました。これは、最大100万トークンという巨大なコンテキストウィンドウと、独自の「圧縮」技術に依存して無限の対話実現を可能にしています。Claude Codeの信条は「全局を掌握し、策を定めてから行動する」です。あらゆるアクションを実行する前に、エージェント検索技術を用いてコードベース全体の構造を徹底的に理解し、複数ファイルを調整して一貫性のある変更を実施します。数万行のコード移行を伴うエンタープライズ級のリファクタリングタスクにおいて、Claude Codeは驚異的な支配力を発揮します。
しかし、時間の経過とともにアプリケーションシーンがさらに広がるにつれて、もともと性質が異なるこの二つのツールは、互いに真似し始めるようになった。

画像提供:MorphLLM
複雑なプロジェクトを処理する際、モノリシックなAIモデルが直面する最大のボトルネックはコンテキスト汚染である。AIに認証モジュールの再構築を依頼すると、40個のファイルを読み込んだ後、最初のファイルのデザインパターンを忘れてしまうことが多い。この課題を解決するために、2社はほぼ同じ答えを提示した:各サブタスクに独立したコンテキストウィンドウを割り当てる。
OpenAIはまもなく、タスクをプロジェクトごとに異なるスレッドに隔離し、クラウド上のサンドボックスで独立して実行する新しいmacOSデスクトップアプリをリリースする。Anthropicはエージェントチームアーキテクチャを発表し、開発者が複数のサブエージェントを派生させ、タスクリストと依存関係を共有させ、それぞれ独立したウィンドウで並列に作業できるようにした。どちらを「クラウドサンドボックス」と呼ぼうが、「エージェントチーム」と呼ぼうが、そのエンジニアリング実装における核心的な理念は完全に一致している。
ベンチマークの成績表では、それらは繊細なバランスを示している。GPT-5.3-Codexは、ターミナルタスクベンチ2.0で77.3%のスコアを記録しリードしている。一方、Claude Codeは複雑なSWE-bench Verifiedランキングで80.8%の成績を収めた。両者はそれぞれの強み領域で極限まで性能を発揮しつつ、自らの弱点を必死に補おうとしている。
OpenClaw効果:高き壁を倒す見えざる手
二社の内部戦略がそれらの同質化をもたらす内因であるとするならば、オープンソースエコシステム全体による圧力は無視できない外的要因である。ここでは、OpenClawがAIプログラミングツール分野全体に与えた深い影響を必ず言及しなければならない。
オープンソースコミュニティによって導入されたワークフローフレームワークであるOpenClawは、大手企業が築き上げてきたエコシステムの高壁を打ち壊したと言える。OpenClawは、大規模モデルとローカルツールチェーンとの相互作用を標準化した。かつて、大規模モデルがローカルのGitコミットを洗練された形で呼び出す方法、セーフティーサンド内でテストスクリプトを安全に実行する方法、複数ステップの推論検証を行う方法は、CodexやClaude Codeが自慢する独自の「ブラックボックス技術」だった。
しかしOpenClawはこれらのプロセスを汎用的なプロトコルとして抽象化しました。これにより、開発者は特定の協調モードに縛られることなく、特定のプラットフォームに依存しなくなりました。オープンソースコミュニティの盛り上がりは、標準化を逆らえない潮流へと変えました。このような状況下で、OpenAIもAnthropicも、このオープンな標準に適合するために姿勢を低くするしかありません。
OpenClawのようなオープンソースの力によって下層の技術的壁が取り除かれ、すべての高度な機能が業界の標準仕様となった今、CodexとClaude Codeの唯一の道は、より微細なユーザーエクスペリエンスの面で無限に競争することである。これが、なぜそれらがますます似て見えるのかという理由だ。標準化された枠組みの中で、最適解はしばしば一つしかない——まるで生物の収斂進化のようだ。
CodexがClaude Codeを追い越そうとしています
Claude Code と Codex は進化の道で近づいていますが、両者には依然として差異があり、特に Codex は一部の面で開発者により好まれています。
前日、r/ClaudeCode コミュニティで、14年の経験を持ち、テクノロジー大手で働いた経験のあるシニアエンジニア u/Canamerican726 が、非常に専門的なレビューを共有しました。
具体的には、彼は8万行のコードを含む複雑なプロジェクトで、Claude Codeに100時間、Codexに20時間をそれぞれ費やした。

彼の視点では、Claude Codeを使用することは、締め切りに追われるエンジニアを指導しているようなもので、非常に速く駆け抜ける一方で、CLAUDE.mdに記された仕様をしばしば無視し、タスクを完了するために既存のファイルに次々とコードを積み重ね、リファクタリングの発想が欠如している。
一方で、Codexは、5〜6年の経験を持つ落ち着いたベテランのように感じられた。処理速度は3〜4倍遅いが、途中で立ち止まって思考し、コードを再構成し、指示の境界を厳密に守る。この高い自律性により、このエンジニアはタスクをそのまま投げて、他のことを安心して行うことができる。
同じ声は、Xなどのソーシャルネットワーク上にも現れている。研究者であるAran Komatsuzakiは、自身の使用経験を踏まえ、フロントエンド分野ではClaude Codeが依然として優位であるが、バックエンドの計画や情報の更新において、ネット検索を頻繁に呼び出すCodexの方がはるかに堅実であると指摘している。

コメント欄には、実際のビジネスシーンでの苦い教訓が満載だ。ある開発者は、Opusに基づくモデルは速いが、多くの「コードクリーンアップ債務」をプロジェクトに積み上げる傾向があると鋭く指摘した。一方、Codexは動作が遅いが、進みながら同時に床を掃除してくれる。あるユーザーは、コンテキストウィンドウの使用率が70%に達した時点で即座に新しいセッションを開始すべきだという生存法则をまとめ、それ以上続けるとシステムから隠されたバグが付いてくる可能性が高いと警告している。

これらの現場からの生の不満は、二つの強力なツールの機能が次第に重なり合う中で、開発者の最終的な陣営選択を左右するのは、「埋め合わせコスト」や「メンタルオーバーヘッド」に関わるこのような微細な体験の差であることを明確に示している。中国のユーザーにとっては、さらに特別な困難も存在する。例えば:

冷静な考察:同質化の背後にあるエコシステムの暗闘
もちろん、CodexとClaude Codeの優劣は開発者次第であり、開発者の能力にもよります。前述のu/Canamerican726の評価報告が要約しているように、ソフトウェア工学を理解していない場合、これらのツールはいずれも劣悪な結果を出力します。ツールはスキルを代用しません。
この言葉は、AIプログラミングツールが長年にわたり醸し出してきたある種の幻想を突き破った。私たちは、十分に強力なAIアシスタントがあれば、初心者であるVobe Coderでも一人でエンタープライズレベルのアプリケーションを構築できると信じていた。しかし現実は、Claude Codeには非常に集中力があり、スキルが優れた「ドライバー」が必要であり、そうでなければ膨大なコードベースの中で方向を見失ってしまう。Codexはより自立しているが、最大の効果を発揮するためには、開発者が正確なシステムコンテキストを提供する必要がある。
では、ツールの機能が今日では非常に同質化している中で、これらの企業の競争優位はどこに移ったのでしょうか?
答えは、退屈な財務諸表と価格戦略の中に隠されている。同じタスクにおいて、Claude Code が消費するトークン数は Codex の3〜4倍にのぼる。使用コストはより高い。企業チームにとって、Claude Code を利用するには開発者1人あたり毎月100〜200ドルの費用が必要だ。一方、Codex はその機能をより手頃なサブスクリプションプランにまとめ、膨大な GitHub コミュニティを通じて多くの基礎ユーザーを獲得している。

画像提供:MorphLLM
Anthropicの野心は、Claude Codeを資金に余裕のある大手テクノロジー企業のワークフローに深く組み込むことにある。例えばStripeは1370人のエンジニアにClaude Codeを使用させ、本来10人が数週間かかる予定だったクロスランゲージコード移行を4日間で完了させた。Rampはこれを活用してイベント対応時間を80%短縮した。一方、OpenAIはその広範なエコシステム浸透率を活かし、Codexを多くの一般開発者のデフォルト選択肢にした。
これはもはや単なる技術競争ではなく、エコシステムの結びつき、価格戦略、そしてユーザーの習慣再構築に関する消耗戦である。
開発者の分かれ道
この一年間の技術進化を振り返ると、GPT-5.4-Cyberのリリースは、この長きにわたる戦いにおけるごく小さな注釈にすぎない。CodexとClaude Codeは「同じ顔」へと向かっており、AIプログラミングツールが、初期の不確実で新奇性に満ちたテスト段階から、成熟し退屈な工業生産段階へと正式に移行したことを示している。
現在、Claude Codeは毎日13.5万回のGitHubコミットを自動生成しており、この数値はネット上の公開コミット全体の4%を占めています。近い将来、ほとんどのボイラープレートコード、基本的なテストケース、そして通常のコードリファクタリングは、ますます似た姿になるこれらのAIエージェントがバックグラウンドで静かに完了するでしょう。

画像提供:MorphLLM & SemiAnalysis / GitHub Search API
能力が無限に近いほど類似し、体験が互いに模倣し合う二つの超ツールに直面して、私たち人間の開発者としての核心的価値はどこに残っているのか?おそらく、ツールの恩恵期はまもなく完全に終焉を迎える。誰もが同じくらい鋭い武器を手にしたとき、真に勝敗を決めるのは、より優れたコード補完速度を誰が持っているかではなく、誰がより良く問題を定義できるか、誰がより広大なシステムアーキテクチャの視野を持っているか、そしてAIで満たされたこのコードの世界で、人間だけが持つ不可替代性を見出せるかである。
ところで、あなたはどれを選びますか?
参照リンク
https://www.morphllm.com/comparisons/codex-vs-claude-code
https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/
https://x.com/arankomatsuzaki/status/2044270102003196007
https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html
本文は微信公衆アカウント「機械の心」(ID:almosthuman2014)より、著者:機械の心
