Anthropicの最新の開示によると、Claudeは現在、企業の本番環境でのマージコードの80%以上を生成しており、2025年2月のリリース前と比較して、単数桁の割合から大幅に向上しています。これは、AIが実際のソフトウェア開発プロセスにさらに深く入り込んでいることを示しています。
コードの割合が8割以上に上昇
会社の開示によると、Claudeは現在、内部のエンジニアリングプロセスにおける主要なコード生成ツールとなっています。ここでいう生産コードとは、テスト段階のドラフトではなく、マージされ本番環境に導入されたコードを指します。
- 現在の本番コードの割合は80%を超えています
- リリース前はわずか一桁%
- 比較対象の時間点は2025年2月前後です
長時間のエンジニアリングタスクを連続して処理可能
Anthropicは、Claudeが最大12時間継続するソフトウェアエンジニアリングタスクを完了できるようになったと述べました。このようなタスクは、コードの補完にとどまらず、デバッグ、修正、テスト、および複数ステップの協力が含まれる可能性があります。
これにより、モデルの使用シーンは短時間の質問応答や断片的なプログラミングから、より完全なエンジニアリング実行プロセスへと拡大しています。
同社はAIの今後の進化について言及しました
この更新で、AnthropicはAIの進展が鈍化する可能性や、AIシステムが次世代AIの開発を支援する递归的自己改善といった、いくつかの可能性のあるシナリオを挙げています。
支持者は、このような能力の向上が医学、数学、科学研究などの分野の進展を加速する可能性があると主張している。一方で、批評者は、これはプログラミング補助ツールの継続的な強化にすぎず、汎用人工知能の実現が近づいていることを証明するには十分ではないと指摘している。
追加情報:本記事内の関連データはAnthropic自身が開示したものであり、主にその内部開発プロセスにおける使用状況を反映したものであり、独立した第三者による測定結果ではありません。
