Si Richard Sutton, tagapagwika ng Turing Award at ama ng reinforcement learning, ay nagkritika sa mga kasalukuyang generative AI dahil sa kanilang panloob na limitasyon: ang mga magandang bahagi ay hindi bagong-bago, at ang mga bagong-bagong bahagi ay hindi maganda.
May-akda ng artikulo, pinagkunan: XinZhiYuan
AI: Ang magandang bahagi ay hindi bagong-bago, ang bagong-bago ay hindi maganda
Isa sa pinakamasamang pagsusuri sa akademikong mundo ay:
Ang trabahong ito ay may bagong ideya at mabuti.
Sadly, the good parts aren't novel, and the novel parts aren't good.
Ngunit si Richard Sutton, isa sa mga tagapagtatag ng larangan ng reinforcement learning, may-akda ng aklat na “Reinforcement Learning,” at tagapagwagi ng Turing Award, ay inilapat ang joke na ito sa buong generative AI.

Sinabi niya: Ang pagsusuri na ito, ay naglalapat sa karamihan sa mga AI na kilala natin ngayon.

AI: Ang magandang bahagi ay hindi bagong-bago, ang bagong-bago ay hindi maganda
Ang pangunahang pahayag ni Sutton ay sobrang maikli, maikli hanggang sa mapanganib.
Ang generative AI ay本质上 ay supervised learning.
Ang lohika ng supervised learning ay: ipakita sa model ang maraming halimbawa na nilikha ng tao, upang matutunan nito ang pagpapakita.
Mas mataas ang puntos kung mas katulad ang pagkakatulad.

May tanong na.
Kapag ang modelo ay gumagawa ng nilalaman ayon sa mga datos ng pagtuturo, mataas ang kalidad ng output dahil ito ay nagpapakita ng mga bagay na napatunayan na ng tao. Ngunit hindi ito makabago. Ito ay nagpapakita lamang ng iba’t ibang kombinasyon at pagpapakilala ng mga bagay na alam na ng tao.
Nang subukan ng model na lumabas sa mga data ng pagtuturo at lumikha ng tunay na bagong nilalaman, bumagsak ang kalidad. Dahil wala itong anumang panloob na mekanismo upang masuri kung “tama ba o mali ang bagong bagay na ito.” Ito ay naglalabas lamang, hindi nag-e-evaluate.
Ito ang structural na contradiction:
Ang pagkakatangi at kalidad ay nasa magkabilang dulo ng isang palakasan.
Kapag inilalagay mo ang isang dulo, tumataas ang kabilang dulo.

Hindi ito isyu ng inhinyeriya. Hindi ito lutasin sa pamamagitan ng pagpupuno ng data, pagpapalawak ng modelo, o pagdaragdag ng higit pang GPU.
Gumamit si Sutton ng isang napakalakas na paghahambing: "kuwento" — ang pinakamalaking kritikang kinakaharap ng malalaking modelo — ay sa katotohanan ay isang produkto ng pagsubok ng modelo na maging "bago".
Ayaw namin ng mga halusinasyon, na nagpapatotoo sa isang bagay: hindi namin talaga kailangan ang pagkakakilanlan. Kailangan namin lamang ang mataas na kalidad na pagkakatulad.
Ang mabuti ay hindi nakakagulat, ang nakakagulat ay hindi mabuti.
Ang masasamang pagsusuri ng reviewer sa tula ay tila eksaktong inilarawan ang loob na limitasyon ng buong generative AI.
Totoong "pagkakakilala" ay nangangailangan ng isang set ng tatlo
Sinuri ni Sutton ang "tatlong pangunahing pormula ng kagalingan" mula sa mga unang prinsipyo:
Totoong pagkakita (Discovery) = Pagkakaiba (Variation) + Pagsusuri (Evaluation) + Pagsasalba ng may pagpili (Retention).
Ang anumang tunay na kreatibidad at pagkakakitaan ay nangangailangan ng tatlong hakbang, at walang isa sa kanila ang maaaring mawala:
1. Ang pagkakaiba (Variation) ay naglalikha ng mga posibilidad na nagkakaiba-iba. Maaaring random, o batay sa umiiral na kaalaman, ngunit kailangan may totoong kawalan ng katiyakan—kung hindi, hindi ito pag-aaral, kundi pagtingin sa tala.
2. Pagsusuri (Evaluation) — Tukuyin kung aling mga pagkakaiba ang may halaga. Kailangan nito ng malinaw na layunin, o isang pamantayan na makakakilala sa «mabuti» at «masama».
3. Piliin ang pagpapanatili (Selective Retention) — iwanan ang mga may halagang pagbabago upang maapektuhan ang mga susunod na aksyon at pagkatuto.
Ang mga hakbang na ito ay hindi nilikha ni Sutton. Ito ay lohika ng natural selection, lohika ng scientific method, at lohika ng pagkatuto ng tao.
Teorya ng evolusyon: Random na mutation sa gene (variasyon) → pagsuri ng kalikasan → pagpapabilang sa pinakamadaling umunlad (selective retention).
Pamamaraang siyentipiko: Pagkakaroon ng hipotesis (baryasyon) → Pagsusuri sa eksperimento (pagtataya) → Pagpapalabas ng papel (pilio at pagpapanatili).
Pagkatuto ng tao: Subukan ang iba’t ibang solusyon (variasyon) → I-verify kung tama o mali (pagtataya) → Tandaan ang epektibong paraan (selective retention).

Ngayon, ang generative AI ay natapos na lang ang unang hakbang ng Trinity: hindi praktikong may pagtataya, mas maliit pa ang pagpili at pagpapanatili,
Parang isang mananapak na nagpapalabas ng mga arrow nang random, ngunit may nakakapit sa mata, at pagkatapos ay hindi niya sinusuri ang layo o binabago ang kanyang posisyon batay sa resulta.
Ipinapangalan mo ito sa pagpapagawa ng isang libo't isang arrow, at minsan ay makakasaklaw ito sa layunin, ngunit hindi ito alam kung bakit naka-target.
Kaya pa ba ang mga siyentipiko?
Dito ay maaaring maramdaman mo ang kaunting pag-aalala: Kung talagang makakagawa ng sarili nitong “pagkakakilala” ang AI sa hinaharap, babagsak ba ang mga siyentipiko?
Ang sariling sagot ni Sutton ay: Hindi mapapalitan, ngunit kailangang magkaroon ng ganap na pagbabago sa papel.
Sa kanyang talumpati, sinabi niya na kahit anong AI na makapagpapatotoo ng isang matematikal na teorema nang mag-isa, kailangan pa rin nito ng tao upang sabihin sa iyo: alin ang mga tanong na mahalaga.
Hindi ito pagkamaba, kundi totoong hangganan ng pagkakaunawa.
Ang matematikong si Shiqian Ma, isang eksperto sa optimization sa Rice University, ay sinabi: Gamit niya ang ChatGPT upang patunayan ang isang problema sa convergence ng isang algoritmo na siya ay pinag-aralan nang buong anim na taon.

May isang pangungusap sa summary:
Napatotohanan ng may-akda ang pagkakagawa ng ChatGPT 5.5.

Ang algoritmong ito ay tinatawag na BDRS, kung saan ang buong pangalan ay Bregman Douglas-Rachford Splitting, at ginagamit upang lutasin ang problema ng Optimal Transport.

Pamagat ng papel: Bregman Douglas-Rachford Splitting Method
Preprint address:
Ito ay isang bagay na kanyang sarili at mga co-author ang disenyo, at ang pagpapatotoo ng konverhensya nito, o kung bakit ito "tama" sa pinakamahigpit na matematikal na kahulugan, ay nagdulot ng pagod sa kanya ng anim na taon.

Ang preprint platform na arXiv ay nananatiling nakapag-isa pagkatapos makatanggap ng pagpapadala.
Nag-impluwensya siya na ang dahilan ay ang pagkakaroon ng mga salitang “ChatGPT” sa abstrak, at hindi alam ng platform kung paano gamitin ang mga papel na ganito.
Pero maaring palitan ng AI ang mga tao?
Ang kanyang sagot ay: Hindi. Sinabi niya nang direkta:
Naniniwala ako na ang AI ay hindi kayang mag-isip nang malikhaing ganitong algoritmo at mangako na “Ito ay isang epektibong algoritmo para sa optimal transport, ngayon subukan kong patunayan ang kanyang convergence.”
Walang tao ang nag-uudyok, ang AI ay hindi alam kung anong problema ang dapat lutasin.

Ang pangungusap na ito ay eksaktong tumutugma kay Sutton: Ang problema mismo, dapat ay itinakda ng tao.
Nag-antay siya ng anim na taon bago «magtanong ng tamang tanong»:
Ano ang mga tanong na dapat itanong, talagang nangangailangan ng malalim na pag-unawa sa paksa.
Sa kasong ito, nag-aral ako ng anim na taon tungkol sa problema na ito, kaya alam kong kung saan ang mga hamon.

Hindi ito nawala sa six na taon, ito ang kinakailangan.
Tama ang anim na taong ito, na nagbigay sa kanya ng pag-unawa kung saan nakakatigil ang patotoo, ano ang dahilan kung bakit lahat ng mga path ay nabigo, at alin sa mga direksyon na ibinigay ng ChatGPT ang dapat patuloyin at alin ang ilusyon.
At hindi isang prompt lang, kundi limang buwan. Ito ang pinakakalituang bahagi, kung saan siya mismo ay nagsugat:

Mula sa Enero hanggang Mayo, limang buwan nang buo, maraming pag-uusap, bawat prompt ay mas lalong nagpapalapit sa patotoo.
Nakapagsummary siya nang lubos na malinaw:

Hindi nagbago ang kaluluwa ng pag-aaral, patuloy pa ring pagsubok at pagkakamali. Ang nagbago ay ang bilis ng bawat pagsubok—at dati ay kailangan ng ilang linggo para patunayan ang isang direksyon, ngayon ay sa ilang minuto na lang ay malalaman kung tama o hindi ang landas.
Ngunit ang kontribusyon ng AI ay hindi malilimutan:

At ang dulo, agad na naging deity:
Bumabalik sa aking papel tungkol sa konverhensya ng BDRS, lubos akong sigurado na ang patotoo ay tama.
Ngunit kung makakita ka ng anumang pagkakamali, ang buong kasalanan ay aking kinikilala—huwag mong ipanagkakasala ang ChatGPT, kasi wala pa itong 3.5 taon.

Ang kagandahan ng pahayag na ito ay nasa kanyang dualidad: ito ay isang tapat na pagsisigla ng responsibilidad, at isang tumpak na metapora.
Ang “3.5 taon” ay naglalarawan sa tunay na kalagayan ng AI ngayon: nakakagulat ang kakayahan, ngunit hindi pa kumpleto ang pagpapasya.
Sapagkat ang mga tao ay hindi naghihintay ng anumang kontribusyon mula sa mga bata na may edad na 3.5 taon.
Habang hindi mo maipapasa ang huling karapatan sa pag-sign ng patotoo sa AI, hindi mo rin dapat isasagawa na walang ambag ang AI.
Ito ang dahilan kung bakit ang mga totoong scientific discovery ay hindi nawawala sa kamay ng tao.
Sa halip, mas mapagkukulang ito sa mga tao: sino ang makakapagtanong ng mabuting tanong, siya ang karapat-dapat na magkaroon ng malakas na AI.
Sa hinaharap, ang mga siyentipiko na hindi gumagamit ng AI ay maaaring maging luma tulad ng mga astronomo na hindi gumagamit ng computer.
Sa huli, isama natin ang pagbabalik-tanaw sa mga pahayag ni Sutton:
Kung nais nating makamit ang buong potensyal ng mga siyentipiko sa AI, dapat nating ibahagi ang mga layunin sa kanila upang makapaglikha, makapag-evaluate, at makapaghahanap, kaya sila ay maaaring makilahok nang buong-pusong sa pagpapatupad ng mga layuning ito.
Maging mas malakas tayo! Gawin nating lubos na awtomatiko ang kreatividad at pagkakakilala!
