Demis Hassabis tungkol sa AGI Timeline, mga Scientific Breakthroughs, at ang Kinabukasan ng DeepMind

I-organize at I-compile: Deep潮 TechFlow

Guest: Demis Hassabis (Founder of DeepMind, 2024 Nobel Prize in Chemistry laureate, Head of Google DeepMind)

Host: Gary Tan

Source ng podcast: Y Combinator

Demis Hassabis: Mga Agente, AGI at Ang Susunod na Malaking Scientific Breakthrough

Air date: April 29, 2026

I-edit ang intro

Ang CEO ng Google DeepMind at tagapagwagi ng Nobel Prize sa Kimika, Demis Hassabis, ay naging bisita sa Y Combinator kung saan pinag-usapan ang mga mahahalagang pag-unlad patungo sa AGI, ang mga payo para sa mga entrepreneur kung paano manatiling nangunguna, at kung saan maaaring mangyari ang susunod na malaking scientific breakthrough. Ang pinakapraktikal na pagtataya para sa mga entrepreneur ng deep tech ay kung ikaw ay magtatayo ng isang sampung taong proyekto sa deep tech ngayon, kailangan mong isama ang pagdating ng AGI sa iyong plano. Bukod dito, ipinahayag niya na may malaking pahayag na darating mula sa Isomorphic Labs (ang AI-based pharmaceutical company na nagsplit mula sa DeepMind).

Mga pinakamahalagang pahayag

AGI Roadmap at Timeline

Ang mga teknikal na komponenteng ito ay malamang na magiging bahagi ng huling arkitektura ng AGI.
Ang mga problema sa patuloy na pagkatuto, mahabang panahon na pag-iisip, at ilang aspeto ng memorya ay hindi pa nalulutas; kailangan ng AGI na sagutin lahat.
Kung ang iyong timeline para sa AGI ay katulad ng aking sarili, na paligid ng taong 2030, at ikaw ay nagsimula ng isang deep tech project ngayon, kailangan mong isama sa pag-iisip na ang AGI ay magkakaroon sa gitna.

Memory and context window

Ang window ng konteksto ay katumbas ng maikling pag-iingat. Ang average na maikling pag-iingat ng tao ay mayroon lamang pitong numero, habang kami ay may mga milyon o kahit milyar na token sa window ng konteksto. Ngunit ang problema ay pinipilit nating ilagay lahat ng bagay dito, kabilang ang mga hindi mahalaga at maling impormasyon, at kasalukuyang ang paraan na ito ay lubos na walang disiplina.
Kung kailangan mong proesuhin ang real-time video stream at i-store ang lahat ng token, ang isang milyong token ay sapat lang para sa halos 20 minuto.

Kakulangan sa pag-iisip

Gusto kong maglaro ng chess gamit ang Gemini. Minamaliit niya minsan na isang masamang hakbang ito, ngunit hindi makakahanap ng mas mabuting pagpipilian, kaya babalik-balik siya at papanood pa rin ng masamang hakbang. Ngunit hindi dapat mangyari ito sa isang eksaktong sistema ng pag-iisip.
Nakakasolve ito ng mga tanong sa antas ng IMO gold medal, ngunit kapag itinatanong nang ibang paraan, mali ito sa mga simpleng aritmetikang problema sa elementarya. Parang kulang sa pag-iisip ng sarili nito.

Agent at Pagkamalikha

Upang makamit ang AGI, kailangan mo ng isang sistema na aktibong lalutasin ang mga problema para sa iyo. Ang Agent ay ang daan na iyon, at naniniwala ako na tayo ay bago lang nagsisimula.
Hindi pa ako nakakakita ng sinuman na gumawa ng isang 3A game na nasa top ng app store gamit ang vibe coding. Ayon sa kasalukuyang pagsisikap, dapat ito ay posible, ngunit hindi pa nangyari. Ito ay nagpapakita na kulang pa ang mga kasangkapan o proseso.

Distillation at small models

Ang ating aksiyon ay ang isang advanced na Pro model ay makakamit ang kanyang kakayahan sa loob ng anim hanggang isang taon pagkatapos ng paglalabas, at maaaring i-compress sa napakaliit na modelo na maaaring i-run sa edge devices. Sa kasalukuyan, hindi pa natin nakikita ang teoretikal na limitasyon sa density ng impormasyon.

Scientific discoveries and the "Einstein Test"

minsan kong tatawagin ito bilang “Einstein Test”—kung kayang pagsanayin ang isang sistema gamit ang kaalaman mula 1901, at pagkatapos ay bigyan ito ng kakayahang mag-derive nang mag-isa ng mga natuklasan ni Einstein noong 1905, kabilang ang Special Theory of Relativity. Kapag kayang gawin ito, malapit na ang mga sistemang ito sa pagbuo ng mga bagong bagay.
Sobra nang magaling na lutasin ang isang Millennium Prize Problem. Ngunit mas mahirap pa ang magbigay ng isang bagong set ng Millennium Prize Problems na itinuturing ng mga pinakamahuhusay na matematiko na magkakaparehong malalim at karapat-dapat sa isang buong buhay na pag-aaral.

Mga rekomendasyon para sa mga startup sa advanced technology

Ang paghahanap ng mga mahirap na tanong at ang paghahanap ng mga simpleng tanong, sa totoo lang, halos pareho lang, tanging iba ang paraan ng pagiging mahirap. Maikli ang buhay, kaya mas mabuting ilagay ang iyong enerhiya sa mga bagay na kung hindi mo gagawin, talagang walang ibang gagawin.

Mga landas sa pagpapatupad ng AGI

Gary Tan: Malawak mo nang pinag-isipan ang AGI kaysa sa karamihan. Sa tingin mo, sa kasalukuyang paraan, ilan na ang natapos na arkitektura ng AGI? Ano ang pangunahing kulang ngayon?

Demis Hassabis: Ang malawakang pre-training, RLHF, chain-of-thought, at iba pang teknolohiya—sobrang sigurado akong magiging bahagi ng huling arkitektura ng AGI. Nakapagpatunay na ang mga teknolohiyang ito sa maraming bagay. Mahirap kong isipin na dalawang taon mula ngayon ay makakakita tayo na ito ay isang dead end—hindi ito makatwiran para sa akin. Ngunit sa ibabaw ng mga umiiral na bagay, baka kulang pa ang isang o dalawang elemento. Ang tuloy-tuloy na pagkatuto (continual learning), mahabang panahon na pag-iisip (long-term reasoning), ilang aspeto ng memorya, at ilang problema ay hindi pa nalulutas. Kailangan ng AGI ang lahat ng ito. Baka sapat na ang umiiral na teknolohiya kasama ang ilang progresibong inobasyon upang maabot ang antas na iyon, ngunit baka may isa o dalawang malalaking pahiwatig na kailangan pang masagot. Hindi ko isipin na hihigit sa isa o dalawa. Sa aking personal na pagtataya, may 50-50 na posibilidad na mayroon pa tayong hindi nalulutas na mahalagang punto. Kaya sa Google DeepMind, pinapalaganap namin ang parehong mga landas.

Gary Tan: Nagkakaroon ako ng pakikipag-ugnayan sa maraming Agent system, at ang pinakamasalot sa akin ay ang pare-pareho lamang na timbang sa ilalim. Kaya ang konsepto ng patuloy na pagkatuto ay partikular na interesante, dahil ngayon, praktikal na gumagamit tayo ng temporaryong tape, tulad ng mga bagay tulad ng “nighttime dream cycles.”

Demis Hassabis: Oo, ang mga siklo ng pangarap ay lubos na kahanga-hanga. Noon ay isinip namin ang pagkakaisa ng mga pangyayaring pangkaranasan. Ang aking doktorado ay tumutok sa kung paano ang hippocampus ay nakakapagpapakilala ng mga bagong kaalaman nang maayos sa umiiral na sistema ng kaalaman. Napakagaling ng utak sa aspetong ito. Ito ay natutupad nito habang natutulog, lalo na sa REM sleep, kung saan ito ay inuulit ang mga mahahalagang karanasan upang matuto mula dito. Ang aming pinakamuna pong Atari program, ang DQN (Deep Q-Network na ipinakilala ng DeepMind noong 2013, na unang nakamit ng antas ng tao sa mga laro ng Atari gamit ang deep reinforcement learning), ay nakakakuha ng kakayahan sa mga laro ng Atari sa pamamagitan ng isang mahalagang paraan: ang experience replay. Ito ay natutunan mula sa neurosiyensya, kung saan inuulit ang mga matagumpay na landas. Ito ay nangyari noong 2013, na itinuturing na panahon ng sinaunang kasaysayan sa larangan ng AI, ngunit napakahalaga nito noon.

Sumasang-ayon ako sa iyo, ngayon ay gumagamit tayo ng tape para i-patch lahat at isaksak sa loob ng context window. Hindi ito mukhang tama. Kahit na ang ating ginagawa ay isang machine at hindi biyolohikal na utak, at teoretikal na maaari itong magkaroon ng context window na nasa milyon o milyar, at ang memorya ay maaaring perpekto, nananatili pa rin ang gastos sa paghahanap at pagkuha. Sa kasalukuyang panahon na kailangan ng espesipikong desisyon, hindi madali makahanap ng totoong may kinalaman na impormasyon, kahit na maaari mong i-save lahat. Kaya naniniwala ako na may malaking puwang para sa inobasyon sa larangan ng memorya.

Gary Tan: Nangungusap nang tapat, ang kontekstwal na window ng isang milyong token ay mas malaki kaysa sa aking inaasahan, at maraming bagay ang maaaring gawin.

Demis Hassabis: Sapat ito para sa karamihan sa mga tamang aplikasyon nito. Ngunit isipin mo, ang window ng konteksto ay katumbas ng working memory. Ang average na working memory ng tao ay lamang pitong numero, habang mayroon tayong working memory na may milyon o kahit milyar na token. Ang problema ay inilalagay natin ang lahat ng bagay dito, kabilang ang hindi mahalaga at maling impormasyon, at ang kasalukuyang paraan ay medyo brutal. At kung gagawin mo ngayon ang pagproseso ng real-time video stream at sinasalamin mo nang buo ang lahat ng token, ang isang milyong token ay sapat lang para sa halos 20 minuto. Ngunit kung gusto mong maunawaan ng sistema ang iyong buhay sa loob ng dalawang hanggang isang buwan, hindi pa sapat iyon.

Gary Tan: Laging malalim ang pagkakaugnay ng DeepMind sa reinforcement learning at search; gaano kalalim ang pilosopiyang ito sa proseso ng pagbuo ninyo ng Gemini? Nananatili pa bang napapababa ang reinforcement learning?

Demis Hassabis: Maaaring talagang mabawasan ang pagkilala dito. Ang interes sa larangang ito ay may pag-usbong at pagbaba. Mula sa unang araw ng pagkakatatag ng DeepMind, kami ay nagtatrabaho sa mga sistema ng Agent. Lahat ng trabaho sa Atari at AlphaGo ay, sa puso nito, mga Agent ng reinforcement learning—mga sistema na kayang magawa ang mga layunin, gumawa ng desisyon, at magplano nang sarili. Sa unang panahon, pumili kami ng larangan ng mga laro dahil kontrolado ang kahirapan, at pagkatapos ay umabot sa mas kumplikadong mga laro, tulad ng AlphaStar pagkatapos ng AlphaGo—sa pangkabuuan, ginawa namin ang lahat ng mga laro na maaari naming gawin.

Ang susunod na tanong ay kung maaari nating generalisahin ang mga modelo na ito bilang mga mundo o wika ng modelo, at hindi lamang bilang mga game model. Sa mga nakaraang taon, nagawa namin ito. Ang pag-iisip at pag-iisip na chain ng lahat ng mga lider na modelo ngayon ay sa puso ay isang pagbabalik sa mga bagay na itinatag ng AlphaGo noong panahong iyon. Naniniwala ako na marami sa aming ginawa noong panahong iyon ay mataas na may kaugnayan sa ngayon, at kami ay muli nang tinitingnan ang mga lumang ideya gamit ang mas malaking iskala at mas pangkalahatang paraan, kabilang ang iba’t ibang mga paraan ng reinforcement learning tulad ng Monte Carlo tree search. Ang mga ideya ng AlphaGo at AlphaZero ay lubos na may kaugnayan sa mga pangunahing modelo ngayon, at naniniwala ako na malaking bahagi ng pag-unlad sa mga susunod na taon ay mabubuo mula dito.

Distillation at small models

Gary Tan: Ngayon, upang maging mas matalino, kailangan ng mas malalaking modelo, ngunit parehong umuunlad ang teknolohiya ng distilasyon, kaya maaaring maging napakabilis ang mga maliit na modelo. Matibay ang inyong Flash model, nakakamit nito ang 95% ng epekto ng mga pinakamoderno na modelo, ngunit ang presyo ay lamang ang sampu-sampu. Tama ba?

Demis Hassabis: Naniniwala ako na ito ay isa sa aming pangunahing kakayahan. Kailangan mong unang gawin ang pinakamalaking modelo upang makamit ang mga pinakabagong kakayahan. Isa sa aming pangunahing kalakasan ay ang kakayahang mabilis na i-distill at i-compress ang mga kakayahan na ito sa mas maliit at mas maliit na mga modelo. Ang pag-distill ay isang paraan na aming nilikha, at hanggang ngayon ay patuloy tayong pinakamalaking eksperto sa mundo. At mayroon tayong malakas na pang-entreprenyurial na motibasyon upang gawin ito. Siguro tayo ang pinakamalaking platform para sa AI application sa buong mundo. Mayroon tayong AI Overviews at AI Mode, kasama ang Gemini, at ngayon, ang bawat produkto ng Google, kabilang ang Maps at YouTube, ay nag-iintegrate ng Gemini o kaugnay na teknolohiya. Ito ay tumutok sa milyun-milyon na user, at sa labindalawang produkto na may bilyon-bilyon na user. Dapat silang maging napakabilis, napakaepektibo, napakamura, at may napakababang latency. Ito ang nagbibigay sa amin ng malaking motibasyon upang gawing pinakaepektibo ang Flash at mas maliit na Flash-Lite models, at umaasa akong ito ay maglilingkod din nang maayos sa iba’t ibang trabaho ng mga user.

Gary Tan: Nag-iisip ako kung gaano katalino ang mga maliit na modelo. May limitasyon ba ang distilasyon? Maaari ba ang 50B o 400B na modelo na maging parehong tatalino sa mga pinakamalaking modernong modelo ngayon?

Demis Hassabis: Hindi ko iniisip na nakarating na tayo sa limitasyon ng teorya ng impormasyon, kung ano man ang nangyayari sa kasalukuyan, wala pa kaming alam kung nakarating na tayo. Baka may araw na makakasalubong tayo sa isang tuktok ng density ng impormasyon, ngunit sa kasalukuyan, ang aming agham ay ang isang advanced na Pro model na ipinapakita ay maaaring ma-compress sa isang napakaliit na modelo, halos maaaring i-run sa edge devices, sa loob ng anim hanggang isang taon. Makikita ninyo ito rin sa mga modelo ng Gemma; ang aming Gemma 4 ay nagpapakita ng napakalakas na performance sa parehong laki. Ginagamit lahat ito ng malaking dami ng teknolohiya ng distilasyon at optimisasyon ng efficiency ng maliit na modelo. Kaya talagang hindi ko nakikita ang anumang teoretikal na limitasyon; iniisip ko na malayo pa tayo sa limitasyong iyon.

Gary Tan: Mayroon ngayong isang napakadakilang pangyayari kung saan ang dami ng trabaho na kayang gawin ng isang engineer ay halos 500 hanggang 1,000 beses ang dami ng noong anim na buwan na ang nakalipas. May ilan dito sa silid na nagtatrabaho na katumbas ng 1,000 beses ang dami ng trabaho ng isang engineer sa Google noong mga taon na 2000. Ito ay sinabi ni Steve Yegge.

Demis Hassabis: Naniniwala ako na masaya ako. Maraming gamit ang mga maliit na modelo. Isa rito ay mababang gastos at mabilis na pagganap, na magdudulot din ng mga benepisyo. Sa pagsulat ng code o iba pang mga gawain, mas mabilis mong ma-iterate ito, lalo na kapag nagco-cooperate ka sa sistema. Kahit hindi ito pinakamoderno, tulad ng 90% hanggang 95% lamang ng pinakamoderno, sapat pa rin ito, at ang iyong natutulungan sa pagiging mabilis sa pag-iterate ay higit pa sa 10%.

Ang isa pang malaking direksyon ay ang pagpapatakbo ng mga modelo sa edge devices, hindi lamang para sa efficiency kundi pati na rin para sa privacy at safety. Isipin ang iba’t ibang device na nagproseso ng napakapersonal na impormasyon, pati na rin ang mga robot—para sa iyong robot sa bahay, gusto mong mag-run ng isang mabilis at makapangyarihang modelo sa lokal, at tanging sa mga partikular na sitwasyon ang ipapasa ang mga gawain sa malalaking modelo sa cloud. Ang audio at video streams ay prosesado sa lokal, at nananatili ang data sa lokal. Maaari kong isipin na ito ay isang magandang panghuling estado.

Memory at Reasoning

Gary Tan: Umulit sa konteksto at memory. Ang modelo ay kasalukuyang walang estado; ano ang karanasan ng developer kung may kakayahang mag-aral nang patuloy? Paano mo tutulungan ang ganitong modelo?

Demis Hassabis: Mahusay ang tanong na ito. Ang kakulangan sa patuloy na pagkatuto ay isang pangunahing hadlang kung bakit ang kasalukuyang mga Agent ay hindi kayang matapos ang buong task. Ang mga Agent sa kasalukuyan ay lubos na kapaki-pakinabang sa mga lokal na bahagi ng task; maaari mong i-puzzle ang mga ito upang gawin ang ilang napakagandang bagay, ngunit hindi sila maaaring mag-adapt nang maayos sa iyong partikular na kaligiran. Ito ang dahilan kung bakit hindi pa sila talagang “fire-and-forget”—kailangan nilang matutunan ang iyong partikular na sitwasyon. Upang makamit ang ganap na pangkalahatang intelihensya, kailangang lutasin ang problema na ito.

Gary Tan: Sa pag-iisip, nasaan na tayo? Malakas na ang chain of thought ng modelo, ngunit patuloy pa ring nagkakamali sa mga pagkakamali na hindi gagawin ng isang matalinong freshman. Ano ang kailangang iayos nang espesipiko? Ano ang inaasahang pag-unlad sa pag-iisip?

Demis Hassabis: Mayroon pa ring malaking puwang para sa inobasyon sa mga paradigma ng pag-iisip. Ang ating mga ginagawa ay patuloy na lubos na pangkalahatan at lubos na mapanlinlang. Maraming direksyon para sa pagpapabuti, tulad ng pagmamasid sa proseso ng chain of thought at pag-intervene sa gitna ng pag-iisip. Madalas kong nararamdaman, anuman ang aming sistema o ang mga sistema ng aming mga kalaban, sila ay sa ilang paraan ay sobrang nag-iisip at nasa loop.

minsan kong ginagawa ang paglalaro ng chess sa Gemini upang masubaybayan. Nakakainteres na lahat ng nangungunang base model ay talagang mahina sa chess. Mahalaga ang pagmamasid sa kanilang proseso ng pag-iisip, dahil ang chess ay isang maayos na naiintindihang larangan, at mabilis kong masusukat kung nasa tamang landas ba sila o hindi, at kung ang kanilang pag-iisip ay epektibo. Ang napanood naming sitwasyon ay minsan sila ay isinasaalang-alang ang isang hakbang, na nauunawaan na ito ay isang masamang hakbang, ngunit hindi makakahanap ng mas mabuting hakbang, kaya bumabalik sila at ginagawa pa rin ang masamang hakbang. Dapat hindi magkaganito ang isang eksaktong sistema ng pag-iisip.

Ang malaking pagkakaiba ay patuloy pa rin, ngunit ang pagpapabuti nito ay maaaring magrequire lang ng isang o dalawang pag-aayos. Ito ang dahilan kung bakit makikita mo ang tinatawag na “jagged intelligence”—kakayahan nito na lutasin ang mga tanong sa antas ng IMO gold medal, ngunit magkakamali sa elementary math kung itanong nang iba’t ibang paraan. Sa pagmumuni-muni sa sariling proseso ng pag-iisip, parang kulang pa sa ilang bagay.

Totoong kakayahan ng agent

Gary Tan: Ang Agent ay isang malaking paksa. May mga tao na nagsasabing ito ay isang pagpapalabas. Sa personal kong pananaw, bago lang ito. Ano ang totoong pagtataya ng DeepMind sa kakayahan ng Agent, at gaano kalayo ito sa mga pangako sa labas?

Demis Hassabis: Sumasang-ayon ako sa iyo, tayo ay nasa simula lang. Upang makamit ang AGI, kailangan mo ng isang sistema na makakatulong sa iyo nang aktibo sa paglutas ng mga problema. Ito ay palaging malinaw sa amin. Ang Agent ay ang daan, at naniniwala ako na tayo ay nasa simula lang. Lahat tayo ay nagtataya kung paano gawing mas epektibo ang pagtutulungan ng mga Agent, at marami sa atin, kabilang ang marami sa inyong lahat, ay nagsagawa ng maraming personal na pagsubok. Paano isama ang Agent sa workflow, upang hindi ito maging karagdagang kagandahan kundi totoo nang gumawa ng pangunahing gawain. Kasalukuyan pa naming nasa eksperimento ang fase. Baka lamang sa mga nakaraang dalawa o tatlong buwan natin mahanap ang mga napakalaking aplikasyon. Ang teknolohiya ay kasiyahan na sa antas na iyon—hindi na ito isang demo para sa laruan, kundi totoo nang nagdadala ng halaga sa iyong oras at efisayensya.

Madalas kong makikita ang mga tao na nagpapagana ng dobleng maraming Agent para sila ay mag-run ng ilang sampung oras, ngunit hindi pa ako sigurado kung ang output ay makakatugma sa input.

Hindi pa natin nakikita ang sinuman na gumawa ng isang 3A game na nasa top ng app store gamit ang vibe coding. Ako mismo ay nagsulat na, at marami sa inyo ay gumawa rin ng ilang magagandang demo. Ngayon, kaya kong gumawa ng isang prototype ng Theme Park sa loob ng kalahating oras—noong 17 taong gulang ako, nanggugol ako ng anim na buwan. Mayroon akong pakiramdam na kung gagawin mo ito sa buong tag-araw, makakagawa ka ng totoong nakakagigil na bagay. Ngunit kailangan pa rin nito ng disiplina at kaluluwa at lasa ng tao; kailangan mong siguraduhing isasama mo ang mga ito sa anumang produkto na iyong binubuo. Sa katotohanan, wala pa ring bata ang gumawa ng isang爆款 game na bumili ng 10 milyong kopya, at dapat naman ay posible ito sa kasalukuyang mga kasangkapan at input. Kaya may kulang pa, maaaring may kaugnayan ito sa proseso o sa mga kasangkapan. Inaasahan kong makikita ko ang ganitong resulta sa susunod na 6 hanggang 12 buwan.

Gary Tan: Sa anong antas ito ay magiging ganap na awtomatiko? Naniniwala ako na hindi agad ito magiging ganap na awtomatiko. Mas malamang na ang mga tao sa loob ng silid ay mabubuo muna ng 1,000 beses na efficiency, pagkatapos ay may magawa ng mga tool na ito na mga sikat na app at sikat na laro, at pagkatapos ay mas maraming mga bahagi ang magiging awtomatiko.

Demis Hassabis: Oo, iyon ang dapat mong makita muna.

Gary Tan: Mayroon din pong bahagi ng dahilan kung bakit ilan sa mga tao ay gumagawa nito, ngunit ayaw nilang ipahayag kung gaano katulungan ng Agent.

Demis Hassabis: Maaaring oo. Ngunit gustong kausapin ko ang problema ng kreatibidad. Madalas kong binabanggit ang AlphaGo, lalo na ang ika-37 na hakbang sa ikalawang laro. Para sa akin, naghihintay ako sa ganitong sandali, at pagkatapos makita ko ito, sinimulan ko ang aking mga proyektong pang-agham tulad ng AlphaFold. Nagsimula kami ng AlphaFold sa araw pagkatapos muling muling bumalik sa Seoul, iyon ay sampung taon na ang nakalipas. Ito ang aking pagbisita sa Korea upang ipagdiwang ang ika-10 taon ng AlphaGo.

Ngunit ang paglalabas lang ng Move 37 ay hindi sapat. Ito ay cool at kapaki-pakinabang. Ngunit kaya ba ng sistemang ito na mag-imbento ng围棋 mismo? Kung ibibigay mo sa ito ang isang mataas na paglalarawan, tulad ng “isang laro na maaaring matutunan ang mga patakaran sa loob ng limang minuto, ngunit mahirap maunawaan kahit sa buong buhay, may magandang estetika, at maaaring matapos sa isang hapon,” at ang sistemang ito ay bumabalik sa iyo ng围棋. Hindi kayang gawin ng mga sistemang ito ngayon. Ang tanong ay bakit?

Gary Tan: Maaaring mayroon sa mga nasa loob ng silid na makakagawa nito.

Demis Hassabis: Kung may nagawa ito, ang sagot ay hindi kawalan ng sistema, kundi ang paraan kung paano natin ginagamit ang sistema. Baka ito ang tamang sagot. Baka may kakayahan na ang mga sistema ngayon, ngunit kailangan ng sapat na genyo na tagapag-ugnay upang palakasin ito, magbigay ng kaluluwa ng proyekto, samantalang ang tao ay malalim na nagkakaisa sa kasangkapan, halos magiging iisa na sila. Kung ikaw ay nananatili araw at gabi sa mga kasangkapan na ito at may malalim na kreatibidad, baka makagawa ka ng mga bagay na higit pa sa imahinasyon.

Open source at multi-modal model

Gary Tan: Magbago tayo ng paksa tungkol sa open source. Ang paglalabas ng Gemma ay nagpapahintulot sa sobrang malakas na mga modelong mag运行 sa lokal. Ano ang iyong opinyon? Mababago ba ng AI na maging bagay na kinokontrol ng user, at hindi na pangunahing nasa cloud? Babago ba ito kung sino ang makakagamit ng mga modelong ito para magbuo ng mga produkto?

Demis Hassabis: Kami ay matatag na tagasuporta ng open source at open science. Ang AlphaFold na iyong nabanggit, libre namin ito sa lahat. Ang aming mga scientific na gawa ay patuloy na ipinapahayag sa mga pinakamataas na journal. Sa kaso ng Gemma, nais naming lumikha ng mga modelong lider sa mundo na may parehong sukat. Sa kasalukuyan, ang kabuuang pag-download ng Gemma ay umabot na sa halos 40 milyon beses, at bago pa lang ito ipinakilala nang dalawang linggo at kalahati.

Naniniwala pa ako na mahalaga ang pagkakaroon ng Western tech stack sa open source. Ang mga open source model ng China ay napakagaling at kasalukuyang nangunguna sa open source, ngunit naniniwala kami na ang Gemma ay napakasalungat sa parehong sukat.

Mayroon pa kaming isang problema sa mga yaman; walang sinuman na may dagdag na computing power upang gawin ang dalawang malalaking modelo. Kaya ang aming kasalukuyang desisyon ay: gamitin ang edge models para sa Android, salming, robot, at iba pa, at gawin itong open source, dahil kapag naka-deploy na sila sa mga device, sila ay nasa panganib na mismo—kaya mas mabuti na buksan nang buo. Nagkakaroon tayo ng isang pinagsamang patakaran sa open source sa antas ng nanometer, at ito ay may malaking estratehikong kahulugan.

Gary Tan: Bago ako pumunta sa entablado, ipinakita ko sa iyo ang AI operating system na aking ginawa; direktang nakakapag-communicate ako sa Gemini gamit ang aking boses, at medyo nervous ako habang ipinapakita ko ito, ngunit nakapagana naman ito. Mula pa sa simula, binuo ang Gemini bilang isang multimodal. Marami nang sinubukan kong mga model, ngunit walang iba pang model na makakapagbigay ng ganitong antas ng deep interaction mula sa boses patungo sa model, kasama ang kakayahan sa pagtawag ng mga tool at pag-unawa sa konteksto, kaysa kay Gemini.

Demis Hassabis: Oo. Isang hindi sapat na kinikilala na kahusayan ng Gemini series ay ang pagbuo nito mula sa simula bilang isang multimodal. Ito ay nagiging mas mahirap sa pag-start kaysa sa paggawa lamang ng teksto, ngunit naniniwala kami na magkakaroon tayo ng matagalang benepisyo, at nagsisimula na itong maging katotohanan. Halimbawa, sa aspeto ng mundo model, binuksan namin ang Genie (isang generative interactive environment model na inimbento ng DeepMind) sa ibabaw ng Gemini. Parehong nangyayari sa larangan ng robotika—ang Gemini Robotics ay magkakabase sa multimodal base model, at ang aming kahusayan sa multimodal ay magiging aming kompetitibong parian. Dumadami rin ang paggamit natin ng Gemini sa Waymo (isang autonomous driving company na ilalim ng Alphabet).

Isipin ang isang digital assistant na sumasama sa iyo sa totoong mundo, maaaring nasa iyong cellphone o salming, na kailangang maunawaan ang iyong paligid at kapaligiran. Sobrang malakas ang aming sistema sa aspetong ito. Magpapatuloy tayong mag-invest sa direksyong ito, at naniniwala ako na malaki ang aming lider sa mga ganitong uri ng problema.

Gary Tan: Bumababa nang mabilis ang gastos sa pagpapaliwanag. Ano ang maaaring mangyari kapag ang pagpapaliwanag ay halos libre na? Babago ba ang inyong direksyon sa pag-optimize dahil dito?

Demis Hassabis: Hindi ko sigurado kung tutol ang pagiging libre ng inference, dahil naroon ang Jevons' Paradox. Naniniwala ako na lahat ng tao ay hahawakan at gagamitin ang lahat ng available computing power. Maaari mong isipin ang milyun-milyon na Agent na nagtatrabaho nang kooperatibo, o isang maliit na grupo ng Agent na nag-iisip nang sabay-sabay sa iba't ibang direksyon at pagkatapos ay i-integrate ang mga resulta. Lahat tayo ay nag-e-experiment sa mga direksyong ito, at lahat ng ito ay magkakasandali sa available na inference resources.

Sa aspeto ng enerhiya, kung masolusyunan natin ang ilan sa mga problema tulad ng kontroladong nuclear fusion, room-temperature superconductivity, at optimal batteries—naniniwala akong sa pamamagitan ng material science ay makakamit natin ito—ang gastos sa enerhiya ay maaaring maging malapit sa zero. Ngunit ang mga proseso tulad ng pisikal na paggawa ng chip ay mayroon pa ring mga hadlang, kung ano man ang mangyayari sa mga susunod na dekada. Kaya ang mga inference endpoint ay magkakaroon pa rin ng mga limitasyon sa quota at kailangan pa ring gamitin nang epektibo.

Susunod na scientific breakthrough

Gary Tan: Mas mainam na mas matalino ang mga maliit na modelo. Mayroong maraming founder sa larangan ng biology at biotechnology dito. Ang AlphaFold 3 ay nagsampa na sa mga protina at lumawak patungo sa mas malawak na spectrum ng mga biomolekula. Gaano kalayo pa tayo sa pagmomodelo ng buong sistemang selula? Ito ba ay isang iba’t ibang antas ng pagkakahirapan?

Demis Hassabis: Sangat baik ang pag-unlad ng Isomorphic Labs. Ang AlphaFold ay isang bahagi lamang ng proseso ng paghahanap ng gamot; nagtatrabaho kami sa mga kaakibat na pag-aaral sa biokimika, pagdidisenyo ng mga kompound na may tamang mga katangian, at malapit nang magkakaroon ng malaking pahayag.

Ang aming panghuling layunin ay gumawa ng isang kompletong virtual na selula, isang buong pagpapagana ng selula na simulator na maaaring i-apply ang mga pagbabago, kung saan ang output ay sapat na malapit sa mga eksperimental na resulta at may praktikal na gamit. Maaari mong i-skip ang maraming hakbang sa paghahanap, at mag-generate ng malaking halaga ng synthetic na data upang matuto ang iba pang mga modelo, upang sila ay makapaghula ng pag-uugali ng tunay na selula.

Nanaisip kong mayroon pang sampung taon hanggang sa makamit ang isang buong virtual na selula. Sa scientific side ng DeepMind, nagsisimula kami sa virtual na nucleus ng selula, dahil ang nucleus ay relatibong sarili. Ang susi sa ganitong uri ng problema ay kung makakakita tayo ng isang slice na may tamang antas ng kumplikado, na sapat na self-contained, kung saan maaari nating makamit ang makatotohanang pagtatantiya ng mga input at output, at pumokus lamang sa sub-system na ito. Ang nucleus ay angkop sa pananaw na ito.

Ang isang iba pang problema ay ang kakulangan ng data. Kinuha ko ang opinyon ng mga lider sa siyensya na nagtatrabaho sa electron microscopy at iba pang imaging technologies. Kung maaari nating i-image ang mga buhay na selula nang hindi ito patayin, ito ay magiging isang pagbabago. Dahil sa ganitong paraan, maaari nating gawing isang visual problem, at alam natin kung paano lutasin ang mga visual problem. Ngunit ayon sa aking kaalaman, wala pa ring teknolohiya na makakapag-imaging ng buhay, dinamikong selula sa resolusyong nanometer nang hindi ito nasasira. Maaari mo nang makakuha ng static image sa anting resolusyon, at napakaganda na nito, napakalaking kasiyahan, ngunit hindi sapat upang agad itong gawing isang visual problem.

Kaya may dalawang daan: isa ay isang hardware-driven, data-driven na solusyon; at ang isa pa ay ang pagbuo ng mas mabuting learnable simulator upang masimulan ang mga sistema ng dinamika.

Gary Tan: Hindi mo lang pinapansin ang biyolohiya. Ang material science, paghahanap ng gamot, pagbuo ng klima, at matematika—kung kailangan mong ayusin, alin sa mga larangan na ito ang magiging pinakamalalim na pagbabago sa susunod na limang taon?

Demis Hassabis: Ang bawat larangan ay nakaka-engganyo, at dito nagmumula ang aking pinakamalaking pasyon, at kung bakit ako nagtatrabaho sa AI nang higit sa 30 taon. Naniniwala ako na ang AI ay ang huling kasangkapan sa agham para sa pag-unlad ng pag-unawa sa agham, pagkakaroon ng mga pagkakataon sa agham, medisina, at pag-unawa natin sa uniberso.

Ang aming orihinal na paglalahad ng misyon ay dalawang hakbang. Una, lutasin ang pagkamatalino, kaya buuin ang AGI; pangalawa, gamitin ito upang lutasin ang lahat ng iba pang mga problema. Kailangan naming baguhin ang pagsasalita dahil may mga tao na nagtanong, “Totoo bang sinasabi ninyo na lutasin ninyo ang lahat ng mga problema?” Oo, iyon ang ibig sabihin namin. Ngayon, unti-unting nauunawaan na ng mga tao kung ano ang ibig sabihin nito. Sa partikular, tinutukoy ko ang mga agham na aking tinatawag na “mga root node problem,” mga larangan na kung masisikat ang pagbubukas nito, magpapalabas ng mga bagong sangay ng pagkakakilala. Ang AlphaFold ay ang prototipo ng aming nais gawin. Higit sa tatlong milyong mananaliksik sa buong mundo, halos lahat ng mga mananaliksik sa biyolohiya ay gumagamit na ng AlphaFold. Mula sa ilang kaibigan kong mga tagapamahala sa mga kumpanya ng gamot, nalaman ko na halos lahat ng bagong gamot na makikita sa hinaharap ay gagamitin ang AlphaFold sa isang bahagi ng proseso ng paghahanap ng gamot. Naiiyak kami dito, at ito ang uri ng impluwensya na nais naming makamtan ng AI. Pero naniniwala ako na ito ay lamang ang simula.

Hindi ko makaisip ng anumang larangan sa agham o inhinyeriya kung saan hindi makakatulong ang AI. Ang mga larangan na iyong nabanggit, naniniwala akong nasa 'AlphaFold 1 moment' na, kung saan ang mga resulta ay may malaking potensyal, ngunit hindi pa lubos na nalutas ang mga pangunahing hamon ng larangan. Sa susunod na dalawang taon, mayroon tayong maraming pag-unlad na pag-uusapan sa lahat ng mga ito, mula sa agham ng materyales hanggang sa matematika.

Gary Tan: Parang promethean, nagbibigay ng isang bagong kakayahan sa tao.

Demis Hassabis: Tama. Tulad ng aral sa kuwento ni Prometheus, kailangan nating maging mapanatag sa paano, saan, at kung paano maaaring mabigyan ng maling paggamit ang ganitong kakayahan.

Mga natutunan na tagumpay

Gary Tan: Marami sa inyong lahat ang nagtatry na magtatatag ng mga kumpanya na nag-a-apply ng AI sa agham. Sa iyong pananaw, ano ang pagkakaiba sa pagitan ng mga tunay na nagpapalaya sa hangganan ng mga kumpanyang ito at ng mga kumpanyang nagpapalabas lamang ng API sa mga pangunahing modelo at sinasabing "AI for Science"?

Demis Hassabis: Isip ko kung ako ang nakaupo sa inyong lugar ngayon, nagmamasid ng mga proyekto sa Y Combinator, ano ang gagawin ko. Isang bagay ay kailangan mong maunawaan ang direksyon ng AI teknolohiya, at mahirap na ito mismo. Ngunit naniniwala ako na may malaking pagkakataon na ihalo ang direksyon ng AI sa isang iba pang larangan ng malalim na teknolohiya. Ang intersection na ito, kahit sa material, medisina, o iba pang totoong mahihirap na agham na larangan, lalo na ang may kinalaman sa mundo ng atom, ay walang mabilis na paraan sa makikita mong hinaharap. Hindi ito lalabas sa pagkakaroon ng susunod na update sa base model. Pero kung hinahanap mo ang mga direksyong may malakas na proteksyon, ito ang aking i-rekomenda.

Laging nagpapahalaga ako sa deep tech. Walang madali sa mga bagay na tunay na matatag at may halaga. Laging nakakatanggap ako sa deep tech. Noong 2010, nagsimula kami at ang AI ay deep tech—sinabi sakin ng mga investor, “Alam namin na hindi ito gagana,” at sa akademya, isang maliit na direksyon na subok at nabigo noong dekada 90. Ngunit kung may paniniwala ka sa iyong ideya—bakit iba ito ngayon, ano ang natatanging kombinasyon ng iyong background—ideally, ikaw mismo ay eksperto sa machine learning at aplikasyon, o kayang bumuo ka ng ganitong founding team—doon ay malaking impluwensya at halaga ang maaaring likhain.

Gary Tan: Mahalaga ang impormasyong ito. Kapag natapos mo na ang isang bagay, tila ito ay natural lamang, ngunit bago ito matapos, lahat ay laban sa iyo.

Demis Hassabis: Oo, kaya kailangan mong gawin ang iyong tunay na pinapahalagahan. Para sa akin, anuman ang mangyari, gagawin ko ang AI. Noong bata pa ako, nagsiyasat na ako na ito ang pinakamalaking epekto na maaari kong gawin. At patunay na ito ay totoo, ngunit maaari ring hindi — baka naman tayo ay 50 taon pa maaga. At ito rin ang pinakamagandang bagay na maaari kong isipin. Kahit ngayon ay nasa isang maliit na garage pa tayo at hindi pa natin ginawa ang AI, sasalig pa rin ako sa paraan upang magpatuloy. Baka babalik ako sa akademya, ngunit hahanapin ko ang anumang paraan upang magpatuloy.

Gary Tan: Ang AlphaFold ay isang halimbawa ng isang direksyon na iyong sinundan at tama ang iyong pagtaya. Ano ang nagiging dahilan kung bakit isang agham na larangan ay angkop upang magdulot ng isang pagtembak na tulad ng AlphaFold? Mayroon bang mga alituntunin, tulad ng isang uri ng target function?

Demis Hassabis: Dapat ko talagang isulat ito sa isang tamang panahon. Ang aral na natutunan ko mula sa lahat ng mga proyektong Alpha tulad ng AlphaGo at AlphaFold ay ang aming kasalukuyang teknolohiya ay pinakamainam na gumagana kapag: Una, ang problema ay may napakalaking kombinatoryal na search space—mas malaki mas mas mainam—hanggang sa walang brute-force o espesyal na algoritmo ang makakasolve nito. Ang espasyo ng mga hakbang sa围棋 at ang espasyo ng konfigurasyon ng mga protina ay mas malaki kaysa sa bilang ng mga atom sa uniberso. Ikalawa, maaari mong malinaw na tukuyin ang target function, tulad ng minimisasyon ng libreng enerhiya ng protina o pagpanalo sa围棋, upang makagawa ang sistema ng gradient ascent. Ikatlo, may sapat na data, o may isang simulator na makakagawa ng napakaraming sintetikong data sa loob ng distribusyon.

Kung tatlong kondisyon na ito ay tumutugma, ang paraan na ito ngayon ay maaaring magdala sa iyo ng malayo upang makahanap ng “karayom sa isang bales ng kahoy” na kailangan mo. Parehong lohika ang nasa paghahanap ng gamot: mayroong isang kompound na maaaring gamutin ang sakit na ito nang walang side effects, at kung ang mga batas ng pisika ay nagpapahintulot sa pagkakaroon nito, ang tanging tanong ay kung paano mahanap ito nang epektibo at praktikal. Naniniwala ako na ang AlphaFold ay unang ipinakita na ang ganitong uri ng sistema ay may kakayahang makahanap ng karayom na ito sa isang napakalaking puwang ng paghahanap.

Gary Tan: Gusto kong umabot sa isang mas mataas na antas. Tinalakay natin kung paano ginamit ng mga tao ang mga paraan na ito upang stikilin ang AlphaFold, ngunit mayroon pa ring isang metapangkat: ang paggamit ng AI ng mga tao upang masuri ang posibleng espasyo ng mga hipotesis. Gaano kalayo pa tayo mula sa pagkakaroon ng mga AI system na kayang gawin ang totoong agham na pag-iisip (hindi lamang pagkakakilanlan ng pattern sa data)?

Demis Hassabis: Naniniwala akong malapit na. Gumagawa kami ng ganitong uri ng pangkalahatang sistema. Mayroon kaming isang sistema na tinatawag na AI co-scientist, at mga algoritmo tulad ng AlphaEvolve na kayang gawin ang mas malalim kaysa sa pangunahing Gemini. Lahat ng mga lab na nasa harap ay nag-aaral sa direksyong ito.

Ngunit hanggang sa ngayon, hindi pa ako nakakakita ng isang tunay, malaking scientific discovery na gawa ng mga sistemang ito. Naniniwala akong malapit na ito. Maaaring may kaugnayan ito sa kreatibidad na pinag-uusapan natin kanina, ang tunay na pagtemo sa mga hangganan ng kilala. Sa antas na iyon, hindi na ito pattern matching, dahil wala nang pattern na maaaring matugunan. Hindi rin ito ganap na extrapolation, kundi isang uri ng analogical reasoning, at naniniwala akong hindi pa magagawa ng mga sistemang ito, o hindi pa natin ito ginagamit nang tama.

Isang karaniwang pamantayan na sinasabi ko sa aking larangan ay kung makapagbigay ito ng isang tunay na interesanteng hipotesis, hindi lang mag-verify ng isang ito. Dahil ang pag-verify ng isang hipotesis ay maaari ring maging isang malaking pangyayari, tulad ng pagpapatotoo sa Riemann Hypothesis o paglutas ng isang problema sa Millennium Prize, ngunit baka tayo ay nasa ilang taon na lamang mula sa paggawa nito.

Mas mahirap pa kaysa dito ay kaya naming magbigay ng isang bagong set ng Millennium Prize Problems na itinuturing ng mga lider sa matematika na magkakaparehong malalim at karapat-dapat na pag-aralan buong buhay. Naniniwala ako na mas mahirap ito ng isang antas, at kasalukuyan naming hindi alam kung paano ito gawin. Ngunit hindi ito isang kamangha-manghang bagay; naniniwala ako na ang mga sistema ay kakayaan nitong gawin sa huli, baka kulang pa lamang ng isa o dalawang bagay.

Ang paraan na maaari nating gamitin upang subukan ay ang minsan kong tawagin itong “Einstein Test”—kaya mo bang i-train ang isang sistema gamit ang kaalaman mula sa 1901, at pagkatapos ay hayaan itong mag-isa na makuha ang mga resulta na nagawa ni Einstein noong 1905, kabilang ang Special Theory of Relativity at iba pang kanyang mga papel noong taong iyon? Naniniwala ako na dapat nating talagang pagsikapan ang pagpapatakbo ng pagsubok na ito, paulit-ulit, upang makita kailan ito maaaring gawin. Kapag naging posible na ito, malapit na ang mga sistemang ito sa pagbuo ng mga bagong bagay.

Mga payo sa pagtatayo ng negosyo

Gary Tan: Huling tanong. Marami sa inyong lahat na may malalim na teknikal na background na nais gawin ang ganitong kalaking bagay; kayo ay isa sa pinakamalalaking organisasyon sa pag-aaral ng AI sa buong mundo. Noong nasa harap ng pag-aaral ng AGI kayo, ano ang isang bagay na alam ninyo ngayon ngunit gustong malaman ninyo noong 25 taong gulang kayo?

Demis Hassabis: Nagsalita na tayo sa ilang bahagi nito. Makikita mo na ang pagharap sa mga mahirap na tanong at sa mga simpleng tanong ay magkakapareho ang antas ng hirap, ngunit iba ang paraan ng pagiging mahirap. May iba’t ibang paraan ng pagiging mahirap sa iba’t ibang bagay. Ngunit maikli ang buhay, at limitado ang iyong enerhiya; mas mabuti na ilagay ang iyong buhay sa mga bagay na kung hindi mo gagawin, walang ibang makakagawa. Gumamit ng pamantayan na ito sa pagpili.

Isa pang bagay, naniniwala ako na sa mga susunod na taon, ang pagkakasundo ng iba’t ibang larangan ay magiging mas karaniwan, at ang AI ay gagawing mas madali ang pagkakasundo ng iba’t ibang larangan.

Ang huling punto ay nakasalalay sa iyong AGI timeline. Ang aking ay sa paligid ng 2030. Kung ikaw ay magsisimula ng isang deep tech project ngayon, karaniwang nangangahulugan ito ng isang sampung taong paglalakbay. Kailangan mong isama sa iyong plano na maaaring lumabas ang AGI sa gitna. Ano ang ibig sabihin nito? Hindi ito laging masama, ngunit kailangan mong isaisip ito. Maaari bang gamitin ng iyong project ang AGI? Paano magiging interaksyon ng AGI system sa iyong project?

Tungkol sa ugnayan ng AlphaFold at mga pangkalahatang AI system na pinag-uusapan natin kanina, isang sitwasyon na makikita ko ay ang Gemini, Claude, o mga katulad na pangkalahatang system na gumagamit ng mga espesyalisadong system tulad ng AlphaFold bilang mga kasangkapan. Hindi naniniwala ako na ilalagay natin lahat sa isang malaking iisang “utak”—hindi makabuluhan ang pagpapaloob ng lahat ng data tungkol sa protina sa Gemini, dahil hindi kailangan ng Gemini na gawin ang protein folding. Tungkol sa iyong sinabi ukol sa efficiency ng impormasyon, siguradong magdudulot ng pagbaba ang mga data ng protina sa kakayahan nito sa wika. Mas mabuting mayroong isang napakalakas na modelong panggamit ng mga kasangkapan na maaaring i-call o itrain ang mga espesyalisadong kasangkapan, ngunit ang mga espesyalisadong kasangkapan ay magkakahiwalay na mga sistema.

Ang ideyang ito ay值得深想, ito ay may epekto sa kung ano ang iyong bubuo ngayon, kabilang ang uri ng pabrika at sistema ng pampalapit na iyong gagawa. Kailangan mong seryosuhin ang AGI timeline, isipin kung ano ang magiging mundo nito, at pagkatapos ay bumuo ng isang bagay na magiging kapaki-pakinabang pa rin nang dumating ang mundo na iyon.