Opus 4.8は現在最も優れたコーディングモデルです。 Cognitionが開発したFrontierCodeは、これまでに見た中で最も高品質なコーディングベンチマークです。 このベンチマークは、ユニットテストによるスコアリングにとどまらず、レグレッションの安全性、機械的なクリーンネス、テストの正確性、スコープ、コードの品質も評価します。 20人以上のオープンソース開発者が、それぞれ40時間以上をかけて150のタスクを手作業で作成しました。 また、より多様なプログラミング言語を対象にテストを行います。




