オープンウェイトのAIモデルが、主要なコーディングベンチマークでGPT-5.5を上回りました。そのコストはOpenAIの料金の約1/6です。6月13日から16日の間に発表されたZ.AIのGLM-5.2は、玩具のようなデモと本番対応ツールを分けるような長く複雑なコーディングタスクに特化しています。
このモデルはFrontierSWEでGPT-5.5を約1%上回り、長期的なコーディングベンチマークにおいてすべてのオープンソースモデルの中で1位を獲得しています。また、PostTrainBenchとSWE-Marathonでも優れた成績を収めており、これらは長時間にわたるインタラクションで複数ステップのエンジニアリング課題を処理するモデルの能力を評価するベンチマークです。
GLM-5.2が実際に何をもたらすのか
GLM-5.2は、Mixture-of-Experts(MoE)アーキテクチャを採用しています。毎回7440億~7530億のパラメータをすべて実行するのではなく、各タスクを最も適した専門家にルーティングし、一度に約400億のパラメータを活性化します。
コンテキストウィンドウは、前世代のGLM-5.1で利用可能だった20万トークンから100万トークンに拡張されました。参考までに、100万トークンは、モデルに大規模なコードベース全体を入力し、それを一度に論理的に処理してもらうことに相当します。
標準的なベンチマークでは、GLM-5.2はTerminal-Bench 2.1で81.0、SWE-bench Proで62.1を記録しました。このモデルは「High」と「Max」の2つの努力レベルをサポートしており、開発者はタスクに応じて速度とパフォーマンスのバランスを調整できます。
完全な重みは、Hugging Faceのzai-org/GLM-5.2でMITオープンソースライセンスのもと公開されており、開発者はほぼ制限なくこのモデルを使用、変更、商業的に展開できます。
Z.AIの急速な反復戦略
かつてZhipu AIとして知られていたZ.AIは、2026年初頭に急成長を遂げています。GLM-5.2は、GLM-5およびGLM-5.1に続く迅速なリリースサイクルで登場しました。初期発表後すぐにAPIアクセスと完全なオープンウェイトが公開され、モデルを自ら実行するのではなくホスト型アクセスを好む開発者向けに特定の価格プランも提供されました。
