OpenAI Secara Tidak Sengaja Menilai Penalaran Model AI, Mendapati Tiada Kehilangan Keterpantauan

iconCryptoBriefing
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Berita AI + kripto: OpenAI mengumumkan beberapa model AI, termasuk GPT-5.4 Thinking dan pelbagai versi GPT-5.4, yang mengalami penilaian rantai pemikiran secara tidak sengaja semasa latihan. Laporan berita di blok rantai menunjukkan analisis dalaman mendapati tiada kehilangan kebolehawasan utama. Kesalahan tersebut mempengaruhi kurang daripada 3.8% sampel latihan. Sebahagian kecil proses tersebut secara salah menilai penaakulan dalaman berbanding hasil akhir. OpenAI memindai semua run pembelajaran penguatan dan mengesahkan kejelasan penaakulan tetap terpelihara. Redwood Research mencatat insiden ini tidak merosakkan kebolehawasan tetapi menonjolkan risiko rantai pemikiran. Model AI kini menjadi sebahagian sistem blok rantai seperti audit kontrak pintar dan perdagangan automatik. Kebolehawasan yang terpelihara adalah penting bagi pembangun dan pelabur dalam projek kripto yang mengintegrasikan AI.

OpenAI mengungkapkan bahawa beberapa model AI-nya, termasuk GPT-5.4 Thinking dan pelbagai iterasi GPT-5.4, mengalami penilaian rantai pemikiran secara tidak sengaja semasa latihan pembelajaran penguatan. Analisis dalaman mendapati tiada penurunan yang signifikan dalam kemampuan model untuk menunjukkan kerja mereka.

Kejadian-kejadian tersebut memberi kesan kepada kurang daripada 3.8% sampel latihan dalam model yang paling terkesan. Sebahagian kecil proses latihan secara tidak sengaja memberi ganjaran atau hukuman kepada model berdasarkan langkah-langkah penalaran dalaman mereka, bukan semata-mata output akhir mereka.

Apa yang sebenarnya berlaku

Penskoran yang tidak disengaja mengambil bentuk yang terhad. Sesetengah latihan memberi ganjaran kepada kebergunaan trajektori, pada dasarnya memberi tanda jempol kepada model berdasarkan sejauh mana laluan penaakulan mereka kelihatan membantu. Yang lain menghukum pemicu yang tidak perlu dalam rantai pemikiran. Kes ujian yang paling ketara menunjukkan kadar pemecah kira-kira 2% untuk menghukum rujukan CoT terhadap kecurangan.

Pasukan dalaman OpenAI menjalankan pemindaian automatik ke atas semua larian pembelajaran penguatan untuk mengkaji kesan terhadap kejelasan penaakulan. Model masih mampu melacak penaakulan logik dengan boleh dipercayai, dan keupayaan untuk mengesan kemungkinan ketidakselarasan tetap utuh secara fungsional.

Ekosistem keselamatan bertindak balas

Organisasi luar termasuk METR, Apollo Research, dan Redwood Research menyumbang wawasan kepada dapatan. Redwood Research mengakui bahawa insiden kecil tidak merosakkan kebolehpantauan tetapi menandakan bahawa penaakulan rantai-pemikiran, sebagai langkah keselamatan, mempunyai kerentanan intrinsik.

Anthropic menerbitkan laporan pada April 2026 yang mengkaji dinamik serupa dalam model miliknya sendiri. OpenAI telah meningkatkan langkah-langkah pengesannya sejak Disember 2025 untuk mencegah ralat penilaian di masa depan. Syarikat ini kini telah melaksanakan sistem pengesanan automatik dan langkah-langkah keselamatan dalaman yang direka khas untuk mengesan pencemaran penilaian CoT sebelum ia mempengaruhi latihan dalam skala besar.

Apa yang ini maksudkan untuk token kripto dan AI

Tiada tindakan pasaran segera diperhatikan terhadap aset kripto yang berkaitan dengan AI selepas pengumuman tersebut. Model AI semakin ditanamkan dalam aplikasi blok rantai, termasuk audit kontrak pintar, agen AI terdesentralisasi, dan sistem dagangan automatik, semua yang bergantung kepada AI yang berfikir dengan betul dan telus.

Fakta bahawa keterlihatan tetap terpelihara adalah kesimpulan utama bagi sesiapa yang membina atau berinvestasi dalam projek kripto yang mengintegrasikan AI. Ia bermaksud infrastruktur keselamatan sekitar model penalaran menangkap masalah sebelum ia menjadi sistemik.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.