Penerima Anugerah Turing dan bapa pembelajaran penguatan, Richard Sutton, mengkritik had dalaman AI generatif semasa: bahagian yang baik bukanlah baru, dan bahagian yang baru tidak baik.
Penulis artikel, sumber: Neoz Yuan
AI: Bahagian yang baik bukanlah sesuatu yang baru, bahagian yang baru pula tidak baik.
Salah satu ulasan paling beracun di kalangan akademik ialah:
Pekerjaan ini both baru dan bagus.
Sayangnya, bahagian yang baik tidak baru, dan bahagian yang baru tidak baik.
Namun Richard Sutton, salah seorang perintis bidang pembelajaran penguatan, penulis buku teks Reinforcement Learning, dan penerima Hadiah Turing, menjadikan lelucon ini sebagai sasaran seluruh AI generatif.

Dia berkata: Penilaian ini berlaku untuk sebahagian besar AI yang kita kenali hari ini.

AI: Bahagian yang baik bukanlah sesuatu yang baru, bahagian yang baru pula tidak baik.
Kesimpulan utama Sutton sangat ringkas, sehingga kejam.
AI generatif pada dasarnya adalah pembelajaran berpengawas.
Logik pembelajaran berpengawas ialah: tunjukkan kepada model banyak sampel yang dicipta oleh manusia, supaya ia belajar meniru.
Semakin serupa tiruan anda, semakin tinggi skor anda.

Masalah datang.
Apabila model menghasilkan kandungan secara ketat berdasarkan data latihan, kualiti output tinggi kerana ia meniru perkara-perkara baik yang telah disahkan oleh manusia. Tetapi ini tidak baru. Ia hanya menggunakan susunan dan kombinasi yang berbeza untuk membungkus semula perkara yang sudah diketahui oleh manusia.
Ketika model cuba menyimpang daripada data latihan dan menghasilkan kandungan yang benar-benar baharu, kualitinya runtuh. Ini kerana ia tidak mempunyai mekanisme dalaman untuk menilai “kayanya benda baharu ini sebenarnya”. Ia hanya akan menghasilkan, bukan menilai.
Inilah kontradiksi struktural itu:
Kebaharuan dan kualiti, dalam kerangka pembelajaran berpengawasan murni, adalah dua hujung jungkat-jungkit.
Apabila kamu menekan satu sisi, sisi lain akan terangkat.

Bukan masalah kejuruteraan. Bukan boleh diselesaikan dengan hanya menambah data, memperbesar model, atau menambah lebih banyak GPU.
Sutton menggunakan perbandingan yang sangat mencolok: "halusinasi" — kelemahan paling banyak dikritik pada model besar — pada dasarnya adalah produk sampingan dari usaha model untuk menjadi "baru".
Kami benci ilusi, yang secara tepat membuktikan satu perkara: kami sebenarnya tidak memerlukan kebaruan. Kami hanya memerlukan tiruan berkualiti tinggi.
Yang baik bukanlah yang baru, yang baru bukanlah yang baik.
Ulasan racun reviewer dalam lelucon itu secara tepat menggambarkan kelemahan dalaman keseluruhan AI generatif.
Penggalian sejati memerlukan tiga komponen
Sutton memecah "rumus trinitas" kreativiti dari prinsip pertama:
Penemuan sejati (Discovery) = Variasi (Variation) + Penilaian (Evaluation) + Penyimpanan berseleksi (Retention).
Sebarang kreativiti dan penemuan sejati memerlukan tiga langkah, tanpa yang mana-mana satu boleh diabaikan:
1. Variasi menghasilkan kemungkinan yang pelbagai. Ia boleh rawak atau berdasarkan pengetahuan sedia ada, tetapi mesti ada ketidakpastian yang sebenar—jika tidak, ia bukan eksplorasi, tetapi carian jadual.
2. Penilaian (Evaluation) menilai variasi mana yang bernilai. Ini memerlukan sasaran yang jelas, atau standard yang mampu mengenal pasti "baik" atau "buruk".
3. Pengekalan pilihan (Selective Retention) – simpan variasi yang bernilai, biarkan ia mempengaruhi tindakan dan pembelajaran masa depan.
Tiga langkah ini bukan penemuan Sutton. Ia adalah logika pemilihan semula jadi, logika kaedah saintifik, dan logika pembelajaran manusia.
Teori evolusi: Mutasi gen rawak (variasi) → Penapisan persekitaran (penilaian) → Kelangsungan hidup yang paling sesuai (pengekalan berseleksi).
Metode saintifik: Mengemukakan hipotesis (variasi) → Uji eksperimen (penilaian) → Terbitkan kertas kerja (pengekalan berseleksi).
Pembelajaran manusia: mencuba pelbagai penyelesaian (variasi) → menguji betul atau salah (penilaian) → mengingat kaedah yang berkesan (pengekalan selektif).

Sekarang, AI generatif hanya menyelesaikan langkah pertama dari Trinitas: hampir tidak ada penilaian, apalagi pengekalan yang dipilih,
Ia seperti seorang pemanah yang melepaskan anak panah secara rawak, tetapi matanya ditutup, dan selepas melepaskan anak panah, ia tidak memeriksa sasaran atau menyesuaikan postur berdasarkan hasilnya.
Katakan ia menembak sepuluh ribu anak panah, kadang-kadang ia akan mengenai sasaran, tetapi ia tidak pernah tahu mengapa ia mengenainya.
Jadi, adakah ilmuwan masih berguna?
Di sini, anda mungkin sedikit cemas: jika di masa depan AI benar-benar mampu menyelesaikan “penemuan” secara mandiri, apakah para saintis akan kehilangan pekerjaan?
Jawapan Sutton sendiri adalah: Tidak boleh digantikan, tetapi peranan perlu berubah secara menyeluruh.
Dalam ucapan beliau, walaupun AI mampu membuktikan teorem matematik secara bebas, ia masih memerlukan manusia untuk memberitahunya: masalah mana yang penting.
Ini bukan kesederhanaan, tetapi batasan kesedaran yang sebenar.
Matematikawan Shiqian Ma, pakar pengoptimuman di Universiti Rice, berkata: Dia menggunakan ChatGPT untuk membuktikan masalah kekonvergenan algoritma yang telah dikaji selama enam tahun penuh.

Satu ayat dalam ringkasan:
Dibuktikan dihasilkan oleh ChatGPT 5.5, telah disahkan oleh penulis.

Algoritma ini dipanggil BDRS, singkatan bagi Bregman Douglas-Rachford Splitting, yang digunakan untuk menyelesaikan masalah penghantaran optima (Optimal Transport).

Tajuk kertas: Kaedah Pemisahan Bregman Douglas-Rachford
Alamat pra-cetak:
Ini adalah sesuatu yang dia dan rakan kongsi mereka sendiri reka, dan selama enam tahun ia mengganggunya ialah bukti kekonvergenannya, iaitu, secara matematik yang paling ketat, “mengapa ia betul”.

Platform pra-cetak arXiv masih menangguhkan penghantaran selepas menerima sumbangan.
Dia menduga sebabnya: terdapat tiga huruf "ChatGPT" dalam ringkasan, dan platform tidak tahu bagaimana hendak mengendalikan tesis semacam ini.
Tetapi adakah manusia boleh digantikan oleh AI?
Jawapannya adalah: Tidak boleh. Dia berkata terus terang:
Saya rasa AI tidak boleh secara kreatif mencadangkan algoritma seperti ini dan mengatakan, "Ini adalah algoritma yang cekap untuk penghantaran optimum, mari saya cuba membuktikan kekonvergenannya."
Tanpa panduan manusia, AI tidak tahu masalah mana yang perlu diselesaikan.

Perkataan ini sepadan secara tepat dengan Sutton: masalah itu sendiri, harus ditakrifkan oleh manusia.
Dia menghabiskan enam tahun untuk "mengajukan soalan yang betul":
Apakah soalan yang perlu diajukan sebenarnya memerlukan anda memahami topik ini dengan sangat mendalam.
Dalam kes ini, saya telah menyelidiki isu ini selama enam tahun, jadi saya tahu dengan jelas kesukaran-kesukarannya.

Enam tahun ini bukanlah pembaziran, tetapi syarat mutlak.
Dalam enam tahun inilah, dia memahami di mana bukti itu gagal, apa sebab semua jalan sebelumnya gagal, dan arah mana yang diberikan oleh ChatGPT yang patut diteruskan serta mana yang ilusi.
Dan bukan sekali sahaja, tetapi lima bulan. Ini adalah tempat yang paling sering disalahfahami, dan beliau sendiri pernah salah faham:

Dari Januari hingga Mei, selama lima bulan penuh, berbilang kali perbincangan, setiap petunjuk semakin mendekati bukti itu.
Dia merumuskan dengan sangat jelas:

Hakikat penyelidikan tidak berubah, ia masih merupakan percubaan dan kesilapan berulang-ulang. Yang berubah ialah kelajuan setiap percubaan dan kesilapan—dulu memerlukan beberapa minggu untuk mengesahkan satu arah, sekarang hanya memerlukan beberapa minit untuk mengetahui sama ada jalan itu boleh dilalui atau tidak.
Namun sumbangan AI tidak dapat dihapuskan:

Kemudian, akhirnya langsung menjadi legenda:
Kembali kepada kertas kerja saya mengenai kekonvergenan BDRS, saya agak yakin buktinya adalah betul.
Tetapi jika anda menemui sebarang kesalahan, tanggungjawab sepenuhnya berada pada saya—jangan salahkan ChatGPT, ia baru berusia 3.5 tahun.

Kekuatan kalimat ini terletak pada dualitasnya: ini adalah pernyataan tanggung jawab yang tulus, sekaligus metafora yang tepat.
“3.5 tahun” menggambarkan situasi sebenar AI pada masa ini: kemampuan yang luar biasa, tetapi penilaian belum matang.
Setelah semua, manusia tidak pernah mengharapkan kanak-kanak berumur 3.5 tahun untuk memberi sumbangan apa-apa.
Walaupun anda tidak boleh menyerahkan hak tanda tangan akhir bukti kepada AI, anda juga tidak boleh berpura-pura bahawa AI tidak memberikan sebarang sumbangan.
Inilah sebabnya, penemuan saintifik sejati tidak akan hilang di tangan manusia.
Sebaliknya, ia akan menyaring manusia dengan lebih kejam: hanya mereka yang mampu mengajukan soalan yang baik yang layak memiliki AI yang kuat.
Di masa depan, ilmuwan yang tidak menggunakan AI mungkin akan ketinggalan zaman, seperti ahli astronomi yang tidak menggunakan komputer.
Akhirnya, mari kita renungkan semula perkataan Sutton yang bersifat deklarasi:
Jika kita ingin memaksimakan sepenuhnya kekuatan saintis AI, kita perlu berkongsi matlamat dengan mereka, membolehkan mereka mencipta, menilai, dan menemui, sehingga terlibat sepenuhnya dalam mencapai matlamat-matlamat ini.
Mari kita lebih berani! Mari kita sepenuhnya mengautomasi kreativiti dan penemuan!
