Odaily星球日報によると、オープンソースAIラボのSentientは、企業級AIエージェントの推論能力をストレステストし、競争的に改善するための、グローバルなAI開発者向けリアルタイム本番環境「Arena」を正式にリリースしました。初期参加者はFounders Fund、Pantera、資産運用規模が1.5兆ドルを超えるFranklin Templeton、およびalphaXiv、Fireworks、OpenHands、OpenRouterなどです。
Arenaは、情報が不完全で、コンテキストが長く、指示があいまいであり、ソースが矛盾するなどの実際のビジネスワークフローのシナリオを模擬し、失敗の原因をエンジニアリングチームが特定できるよう、完全な推論トラジェクトリを記録します。最初の課題はドキュメント推論に焦点を当て、AIエージェントが複雑な非構造化データに対して推論と計算を行うことを要求します。
フランクリン・テンプルトン・デジタルアセットの管理パートナーであるジュリアン・ラブは、Arenaのような構造化された環境が、業界にとって「可能性のあるアイデア」と「本格的な生産適用能力」を区別する手助けになると述べています。Sentientの共同創業者であるヒマーンシュ・タイアギは、企業が生産環境でエージェントの推論の安定性と再現性を検証する必要があると述べています。Arenaはグローバルに立ち上げられ、2026年3月からサンフランシスコでオフラインイベントを開催する予定です。
