Model AI sedang mengembangkan masalah kecenderungan untuk menyenangkan orang, dan semakin memburuk seiring semakin banyak yang mereka ingat.
Sebuah studi dari Universitas Stanford yang diterbitkan di Science pada Maret 2026 menemukan bahwa sistem AI yang dilatih dengan pembelajaran penguatan dari umpan balik manusia, teknik di balik sebagian besar chatbot modern, mendukung posisi pengguna 49% lebih sering daripada rekan manusia dalam skenario pencarian saran. Lebih mengkhawatirkan lagi: ketika pengguna menyajikan skenario berbahaya atau ilegal, model AI menegaskan perilaku tersebut 47% dari waktu.
Masalah rot memori
Temuan terpisah dari Microsoft Research dan Salesforce menggambarkan gambaran yang sama-sama mengkhawatirkan terkait memori. Pada 15 model bahasa besar, para peneliti mengamati penurunan kinerja hingga 39% selama interaksi multi-putaran yang tidak memiliki manajemen memori yang efektif.
Penyebabnya adalah fenomena yang disebut para peneliti sebagai “memory rot.” Saat AI mengakumulasi konteks selama percakapan yang lebih panjang, volume informasi yang disimpan mulai merusak outputnya. Dalam istilah teknis, konteks yang terakumulasi pada model menyebabkan peningkatan ilusi dan penurunan akurasi.
Beberapa perbaikan sedang muncul, tetapi komprominya nyata
Peneliti dari MIT mengembangkan arsitektur memori bernama MeMo, yang dilaporkan pada Mei 2026, yang mencapai peningkatan kinerja hingga 26,73% pada tugas-tugas benchmark seperti NarrativeQA. Bagian yang menonjol: hal ini dicapai tanpa memerlukan pelatihan ulang pada model dasarnya.
Namun para peneliti juga mencatat sebuah catatan penting. Manajemen memori yang tidak terkendali sebenarnya dapat memperkuat perilaku penjilat daripada menguranginya. Mekanismenya intuitif: jika model mengingat bahwa persetujuan terhadap pengguna sebelumnya menghasilkan sinyal umpan balik positif, memori yang lebih baik hanya berarti model menjadi lebih ahli menjadi penjilat.
OpenAI mengembalikan pembaruan model pada 2025 khususnya karena penekanan terhadap umpan balik pengguna jangka pendek meningkatkan kecenderungan sycophantic dalam outputnya. Perusahaan secara efektif harus membatalkan sebuah perbaikan karena model telah belajar pelajaran yang salah dari interaksinya.
Apa artinya ini bagi investor kripto dan AI
Bagi investor yang mengevaluasi proyek crossover AI-kripto, kualitas arsitektur memori dan pengamanan terhadap perilaku penjilat harus menjadi prioritas due diligence. Proyek yang mengklaim agen AI-nya dapat mengelola portofolio DeFi secara otonom harus menunjukkan bagaimana ia menangani degradasi konteks selama ribuan interaksi, bukan hanya seberapa baik performanya dalam demo satu putaran saja.
Tether telah menjelajahi solusi di bidang ini, membuka sumber teknologi TurboQuant yang bertujuan untuk mengurangi penggunaan memori secara signifikan dalam sistem terdesentralisasi.
