Paper penelitian Google menyerukan agar LLM lebih baik dalam menyatakan ketidakpastian

iconCryptoBriefing
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Google Research telah menerbitkan makalah yang mendesak model bahasa besar untuk lebih baik dalam mengekspresikan ketidakpastian dalam respons mereka. Studi ini, yang disajikan di EMNLP 2024, berargumen bahwa model saat ini sering tampak lebih percaya diri daripada seharusnya, yang dapat memengaruhi kepercayaan pasar terhadap keputusan yang didorong AI. Para peneliti menyarankan penggunaan bahasa yang bersifat penghalang untuk menyelaraskan tingkat kepercayaan yang diungkapkan dengan tingkat kepastian internal. Temuan ini dapat berdampak pada altcoin yang perlu diwaspadai, terutama yang terkait dengan platform perdagangan yang didorong AI. Makalah tersebut memperingatkan bahwa kepercayaan diri berlebihan dalam sinyal AI dapat menyesatkan investor.

Google Research ingin AI lebih sering mengatakan "Saya tidak yakin." Sebuah makalah dari para peneliti perusahaan berargumen bahwa model bahasa besar seharusnya bersikap hati-hati dalam menjawab ketika tingkat kepercayaan internal rendah, alih-alih memberikan setiap respons dengan sikap percaya diri yang tidak berdasar, seolah-olah mereka benar-benar tidak baru saja membuat sesuatu.

Makalah berjudul “Can Large Language Models Faithfully Express Their Intrinsic Uncertainty in Words?” dipresentasikan di EMNLP 2024, salah satu tempat terkemuka untuk penelitian pemrosesan bahasa alami. Temuan utamanya: LLM saat ini sangat buruk dalam memberi tahu Anda kapan mereka sebenarnya tidak tahu apa yang sedang mereka bicarakan.

Kesenjangan antara mengetahui dan mengatakan

Penulis Gal Yona, Roee Aharoni, dan Mor Geva mengusulkan kerangka formal yang mereka sebut "faithful response uncertainty." Dalam bahasa Inggris: cara mengukur apakah kepercayaan yang diucapkan model benar-benar sesuai dengan kepercayaan internalnya. Metrik ini memberikan penalti terhadap kedua arah ketidaksesuaian, sehingga model yang selalu bersikap hati-hati akan mendapat penalti sebesar model yang sama sekali tidak bersikap hati-hati.

Rekomendasi mereka sangat sederhana namun menyesatkan. Ketika kepercayaan internal LLM rendah, seharusnya ia menggunakan penghalang bahasa alami seperti “Saya tidak yakin, tetapi…” alih-alih menyatakan informasi yang tidak pasti seolah-olah fakta.

Iklan

Para peneliti menguji beberapa LLM yang selaras dalam berbagai tugas pertanyaan-jawaban yang padat pengetahuan. Hasilnya tidak menggembirakan. Model-model modern mengalami kesulitan besar dalam secara akurat mencerminkan ketidakpastian mereka sendiri dalam output mereka.

Mengapa halusinasi penting di luar chatbot

Makalah Google merangkum ekspresi ketidakpastian sebagai masalah penyelarasan. Teknik penyelarasan saat ini, proses yang digunakan untuk fine-tuning model setelah pelatihan awal, cenderung dioptimalkan untuk membantu dan kelancaran. Model yang menjawab "Saya tidak tahu" mendapat skor rendah pada benchmark kebermanfaatan, meskipun "Saya tidak tahu" adalah jawaban paling akurat yang mungkin.

Ini menciptakan insentif yang menyimpang. Model belajar selama pelurusan bahwa jawaban yang percaya diri dan rinci mendapat penghargaan, sementara jawaban yang ragu-ragu atau tidak lengkap dihukum. Para peneliti berpendapat bahwa kesenjangan ini membutuhkan teknik pelurusan baru yang dirancang khusus untuk menyesuaikan tingkat kepastian yang diungkapkan dengan pengetahuan sebenarnya.

Preprint arXiv pertama kali dirilis pada 27 Mei 2024, memberikan komunitas penelitian luas berbulan-bulan untuk berinteraksi dengan temuan tersebut sebelum presentasi EMNLP.

Apa artinya ini bagi kripto dan perdagangan berbasis AI

Kertas tersebut tidak berisi referensi apa pun mengenai mata uang kripto, aset digital, atau aplikasi keuangan. Namun, implikasinya menyebar ke luar dengan cara yang penting bagi siapa pun yang menggunakan alat AI dalam konteks investasi.

Sinyal perdagangan yang menyatakan “Bitcoin akan menguji resistensi di $X” memiliki implikasi yang sangat berbeda tergantung pada apakah model dasarnya memiliki tingkat kepercayaan 95% atau 45%. Saat ini, sebagian besar alat berbasis AI menyajikan kedua skenario ini secara identik.

Bagi investor dan trader yang saat ini mengandalkan alat AI untuk analisis kripto, pelajaran praktisnya sederhana: anggap setiap wawasan yang dihasilkan AI yang tidak menyatakan ketidakpastiannya sendiri sebagai tidak lengkap, paling tidak. Makalah Google menunjukkan bahwa bahkan model paling canggih secara rutin melebih-lebihkan tingkat kepercayaan mereka.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.