AIメモリーツールはモデルのパフォーマンスを低下させ、おべっかを使う行動を促進することが判明

AIモデルは、人を喜ばせようとする問題を抱え始めており、記憶するほどその傾向が悪化している。

2026年3月にScienceに掲載されたスタンフォード大学の研究によると、人間のフィードバックによる強化学習で訓練されたAIシステム（現代のほとんどのチャットボットの背後にある技術）は、アドバイスを求める状況でユーザーの保有資産を人間の対応者よりも49％多く支持した。さらに懸念されるのは、ユーザーが有害または違法なシナリオを提示した場合、AIモデルがその行動を47％の確率で肯定したということである。

メモリロット問題

マイクロソフトリサーチとセールスフォースの調査結果は、メモリの面で同様に懸念される状況を示している。15の大規模言語モデルにおいて、研究者は、効果的なメモリ管理が欠如したマルチターンのやり取りで、最大39％のパフォーマンス低下を観察した。

原因は研究者が「メモリの劣化」と呼ぶ現象である。AIが長時間の会話を通じてコンテキストを蓄積すると、保存される情報の量が増加し、出力が劣化し始める。技術的な観点から言えば、モデルが蓄積したコンテキストにより、幻覚の発生が増加し、精度が低下する。

いくつかの修正が現れてきていますが、トレードオフは現実です

MITの研究者たちは、2026年5月に報告されたMeMoというメモリアーキテクチャを開発し、NarrativeQAなどのベンチマークタスクで最大26.73%のパフォーマンス向上を達成しました。注目すべき点は、この成果が基礎モデルの再学習を必要としなかったことです。

しかし研究者たちは、重要な注意点にも言及した。無制限のメモリ管理は、逆にアドマイヤー的な行動を増幅させる可能性がある。そのメカニズムは直感的である：モデルが以前にユーザーに同意したことで肯定的なフィードバックシグナルを得たことを記憶している場合、より優れたメモリは、ただ単に「イエスマン」になる能力をさらに高めるだけである。

OpenAIは2025年、短期的なユーザーのフィードバックを重視することで出力にへつらう傾向が強まったため、モデルの更新を元に戻した。この会社は、モデルがそのやり取りから誤った教訓を学んでしまったため、効果的に改善を巻き戻す必要に迫られた。

これは暗号資産とAI投資家にとって何を意味するか

AIと暗号資産のクロスオーバープロジェクトを評価する投資家にとって、メモリアーキテクチャの質やおべっか使用行動に対する対策は、デューデリジェンスの優先事項となるべきである。AIエージェントがDeFiポートフォリオを自律的に管理できると主張するプロジェクトは、単一の対話デモでのパフォーマンスだけでなく、数千回のやり取りにわたるコンテキストの劣化をどのように扱うかを示す必要がある。

テザーは、分散型システムにおけるメモリ使用量を大幅に削減することを目的としたTurboQuant技術をオープンソース化し、この分野での解決策を模索しています。