Ang AlphaFold throne ay nasa panganib!
Nature ay naglathala ng artikulo: Binigyan ng malaking pagpapalakas ni Zuckerberg ang Biohub, na naglunsad ng 1.1 bilyon na mga paghuhula sa istruktura ng protein, na 800 milyon higit pa kaysa sa database ng AlphaFold.
Ang AI model sa likod, ESMFold2, ay sinasabing mas mahusay sa lahat ng aspeto kaysa sa AlphaFold3.
Mas mahalaga pa, bukas ang source at walang limitasyon sa komersyal na paggamit.

https://www.nature.com/articles/d41586-026-01686-3
Ang matagal nang dominasyon ng Google DeepMind sa AI para sa protina ay tinatapos ng isang open-source na nagpapabagabag.
Ang格局 ng protein AI赛道 ay maaaring mabago.
1.1 bilyon mga istruktura ng protina, handa na sa inyong mesa
Noong Mayo 27, ang Biohub, ang biomedikal na institusyon na itinatag ni Zuckerberg at asawa, ay opisyal na isinampa ang ESM Atlas, isang database ng protein structure.
1.1 bilyon na hinulaang istruktura ng protina, kasama ang 6.8 bilyon na impormasyon ng sekwensya ng protina.
Ang database ng AlphaFold ay nagtipon ng higit sa 200 milyong mga pagpapalagay na istruktura, habang ang ESM Atlas ay nagdagdag ng 800 milyon pa.
Ang AI model na nagbuo ng mga ito ay ang ESMFold2, na inilikha sa ilalim ng pamumuno ni Alex Rives, ang pangulo ng siyensya ng Biohub.

Sabi ni Rives:
Nagpapakita ang grapong ito ng buong larangan ng biyolohiya ng protina, lalo na ang mga bahaging pinakakakaibigan.
Bakit mahalaga ang paghuhula ng istruktura ng protina?
Ang mga protina ay ang mga pangunahing bahagi na nagpapagana sa buhay; ang pagkilala sa kanilang anyo ay nagpapahintulot sa atin na maunawaan ang kanilang paggana, at sa gayon ay makapagdisenyo ng mga bagong gamot at labanan ang mga sakit.
Ang AlphaFold ay nagwagi ng Nobel Prize sa Kimika dahil dito, isang markang kaso kung paano binago ng AI ang agham.
Ngayon ay lumabas ang isang bagong modelo na may dataset na 5 beses na mas malaki.
Ano ang mga kakayahan ng ESMFold2 bilang isang AI model?
Ang ESMFold2 ay sumunod sa isang iba't ibang teknikal na landas kaysa sa AlphaFold.
Binubuo ito sa pamamagitan ng «protein language model» na ipinakilala noong 2024, na nagmumula sa mga ideya mula sa larangan ng NLP, kung saan ang mga protein sequence ay binabasa bilang «wika», at tinuruan sa milyon-milyon na data ng protein upang matutunan ng model na direktang makapaghula ng 3D na istruktura mula sa sequence.
Dapat makakakilala ang mga AI na katulad ng AlphaFold dito, dahil pareho ang lohika sa pagkatuto ng malalaking modelo ng wika sa mga tao.
Ang sakop ng training data ay isang mahalagang variable.
Ang ESMFold2 ay naglalaman ng malaking dami ng data tungkol sa mga mikrobyal na protina mula sa lupa, dagat, at iba pang kalikasan, na kalahatan ng mga ito ay walang laman sa database ng AlphaFold.
Mas malawak ang sakop, mas kompleto ang «mundo ng mga protina» na nakikita ng modelo.
Sinabi ng koponan ng Biohub na mas mahusay ang ESMFold2 sa paghuhula ng kompleksong istruktura ng pagitan ng mga protina kaysa sa AlphaFold3.
Ngunit ang pinakamakapagpapatotoo ay ang pagpapatotoo sa praktika.
Ginawa ng tim ng ESMFold2 ang mga bagong protina, at sinubok sa laboratorio; ang malaking bahagi ng mga disenyo ay gumana ayon sa inaasahan.
Mula sa “pagsusuri” patungo sa “paggawa” at pagkatapos ay “pagsusuri,” ang serye na ito ay nagiging epektibo, at ang halaga ay nagmumula sa papel patungo sa totoong mundo.

Buong bukas ang source, iyon ang pinakamalaking pana
Ang pinakamalakas na kahusayan ng ESMFold2 ay ang ganap na open source at walang pagkakabawas sa komersyal na paggamit.
Mas malinaw ang estratehikong kahalagahan ng pagpili na ito sa konteksto ng buong industriya ng AI.
Bagaman may bukas na database ang AlphaFold, may limitasyon ang AlphaFold3 sa komersyal na paggamit sa panahon ng paglunsad.
Ang protein interaction prediction model na inilabas ng Isomorphic Labs, isang subsidiary ng Google DeepMind, ay ganap na propiyetaryo ito sa taong ito.
Karagdagang pagbabasa: Ipinakilala ng Google ang «AlphaFold 4», hindi na bukas sa publiko! Mas mataas ang performance kaysa sa nakaraang bersyon
Direktang binanggit ni Ovchinnikov, ang kompyutasyonal na biyologo ng MIT, ang halaga ng open source: “Inaasahan kong marami ang magiging excited na subukan ang ESMFold2.”
Ang leverage ng open-source AI sa larangan ng malalaking modelo sa wika ay napatunayan nang buong-pusong, at ang Llama series ng Meta ay ang pinakamabuting halimbawa.
Isang sapat na malakas na open-source na modelo na makakapagpapalaya sa pandaigdigang komunidad upang i-iterate, i-apply, at matuklasan ang mga paggamit na hindi inisip ng orihinal na developer.
Ang sitwasyon sa larangan ng protein AI ay mas espesyal; mayroong malaking bilang ng mga laboratorio at pananaliksik na institusyon sa buong mundo na nangangailangan ng isang libre at walang limitasyon na kasangkapan para sa paghuhula ng istruktura, kahit gaano pa kalakas ang mga modelong pampribado, ang bilang ng mga gumagamit na makakarating ay limitado lamang.
Pinili ng Biohub ang kompletong pag-open source, na pareho ang diskarte sa mga malaking wika model ni Meta.
Ang estratehiya ni Zuckerberg sa larangan ng AI ay naging mas malinaw—gamitin ang open source bilang imprastruktura, at ang ekosistema bilang parapet.

Mga ka-industriya, bili ba o hindi?
Positibong reaksyon mula sa akademya, ngunit malinaw ang mga pag-aalala.
Kinauupuan ni Gemma Atkinson mula sa Lund University sa Sweden ang ESM Atlas na "dapat maging isang nakakagulat na yaman sa biyolohiya."

Recognizes its value, but emphasizes that prediction results require independent validation.

Mas malalim na tanong mula kay Martin Steinegger ng Seoul National University.

Ang kanyang nalalaman ay kung paano magpapakita ang ESMFold2 sa mga "bagong istruktura" na may malaking pagkakaiba sa mga kilalang protina.
Nakita ng kanyang koponan na ang unang bersyon ng ESMFold ay hindi nakakatulong sa aspetong ito. Ang problema ay patuloy na hindi nalulutas para sa ESMFold2.
Binigay ni Ovchinnikov ng MIT ang pinakamalinaw na pagtataya, na naniniwala siya na mas angkop na ipakilala ang ESM Atlas bilang karagdagan sa AlphaFold database.

Pinagbigyang-diin niya na ang mga sariling modelo ng Isomorphic Labs at ilang modelo ng Biohub na walang direktang paghahambing sa mga open-source model, ay nakamit din ang parehong antas ng mga resulta.
Ang lead ng ESMFold2 ay maaaring hindi gaanong malaki kaysa sa ipinapahiwatig ng papel.
Ang pagiging mapagbantay na ito ay direktang nagpapakita na ang kompetisyon sa larangan ng protein AI ay nasa apoy na antas.
Ang mga modelong open-source, closed-source, akademiko, at komersyal ay nag-iikot nang sobrang mabilis.
Ang "pinakamalakas" ngayon ay maaaring malampasan sa loob ng anim na buwan. Ang ritmo na ito ay napakatulad na sa arms race sa larangan ng malalaking language models.
Kapag umuunlad ang AI sa pagbabasa ng source code ng buhay
Noong nakaraan, ang pagpapaliwanag ng three-dimensional structure ng isang protein ay maaaring magtagal ng ilang buwan hanggang sa ilang taon ng laboratoryong gawain.
Ang AlphaFold ay unang ipinakita na ang AI ay maaaring gawin ito sa loob ng ilang minuto.
Ngayon, ang ESMFold2 ay nagpapalawak ng prediction scale patungo sa 1 bilyon, na nakakapalibot sa malaking bilang ng mga protina na dating hindi pa nabigkas.
Kung susundin natin ang landas na ito, kapag kayang mag-predict nang tumpak ng AI sa lahat ng istruktura ng protein, makakalikha ng mga bagong functional na protein at masusubok na epektibo sa eksperimento, mas malapit na maaaring maging realidad ang AGI sa larangan ng life sciences kaysa sa inaasahan ng marami.
Kung talagang dumating ang ASI, hindi na ang biyolohiya isang larangan na kailangang “masuri” kundi isang sistema na maaaring “inhenyera”.
Disenyo ang buhay sa antas ng molecule, kustomisahin ang mga protina ayon sa pangangailangan, at isulat muli ang mga patakaran ng evolusyon.
Mukhang sci-fi, ngunit ang mga kasangkapan tulad ng ESMFold2 ay nagpapalapit sa "sci-fi" patungo sa isang "engineering problem".
Ngayon, 1.1 bilyon mga istruktura ng protina ay nakalat sa mesa, at ang anumang siyentipiko sa buong mundo na may koneksyon sa internet ay maaaring makakuha nito nang libre.
Ibig sabihin nito, ang kakayahan ng AI na maunawaan ang buhay ay umabot sa isang mas mataas na antas.
Mga sanggunian: https://www.nature.com/articles/d41586-026-01686-3
Nakuha mula sa WeChat public account na “Xinzhiyuan,” may-akda: ASI Revelation; editor: Marco
