Kursi AlphaFold terancam!
Nature menerbitkan artikel: Biohub milik Zuckerberg melepaskan terobosan besar, secara bersamaan merilis 1,1 miliar prediksi struktur protein, 800 juta lebih banyak daripada database AlphaFold.
Model AI di baliknya, ESMFold2, diklaim memiliki kinerja yang secara menyeluruh melebihi AlphaFold3.
Yang lebih penting lagi, sepenuhnya open source, tidak membatasi penggunaan komersial.

https://www.nature.com/articles/d41586-026-01686-3
Kepemimpinan jangka panjang Google DeepMind dalam AI protein sedang digoyahkan oleh seorang pengganggu open-source.
Peta jalan lintasan AI protein mungkin akan ditulis ulang.
1,1 miliar struktur protein, siap disajikan
Pada 27 Mei, lembaga biomedis Biohub yang didirikan oleh pasangan Zuckerberg secara resmi meluncurkan database struktur protein bernama ESM Atlas.
1,1 miliar prediksi struktur protein, ditambah 6,8 miliar informasi urutan protein.
Database AlphaFold telah mengakumulasi lebih dari 200 juta prediksi struktur, sementara ESM Atlas langsung menambahkan 800 juta lagi.
Model AI yang menghasilkan prediksi ini disebut ESMFold2, dikembangkan di bawah kepemimpinan Alex Rives, Kepala Ilmuwan Biohub.

Rives mengatakan:
Grafik ini menampilkan gambaran lengkap biologi protein, terutama bagian-bagian yang paling tidak diketahui.
Mengapa prediksi struktur protein penting?
Protein adalah komponen inti yang menjalankan kehidupan; mengetahui bentuknya memungkinkan kita memahami fungsinya, sehingga dapat merancang obat baru dan mengatasi penyakit.
AlphaFold memenangkan Hadiah Nobel Kimia berkat ini, menjadi contoh ikonik bagaimana AI mengubah ilmu pengetahuan.
Sekarang sebuah model baru muncul dengan dataset 5 kali lebih besar.
Sebagai model AI, keunggulan ESMFold2 terletak di mana
ESMFold2 mengikuti jalur teknis yang berbeda dari AlphaFold.
It is built on the "protein language model" released in 2024, drawing inspiration from NLP approaches by treating protein sequences as "language," and trained on billions of protein data points to enable the model to predict 3D structures directly from sequences.
Rekan-rekan AI AlphaFold di sini seharusnya merasa familiar, karena ini sama dengan logika model bahasa besar yang belajar bahasa manusia.
Cakupan data pelatihan adalah variabel kunci.
ESMFold2 memasukkan sejumlah besar data protein mikroba dari lingkungan seperti tanah dan laut, yang merupakan bagian kosong dalam database AlphaFold.
Cakupan yang lebih luas, model akan memiliki pemahaman yang lebih lengkap tentang 'dunia protein'.
Tim Biohub menyatakan bahwa ESMFold2 unggul dalam memprediksi struktur kompleks interaksi antar protein dibandingkan AlphaFold3.
Namun, yang paling meyakinkan bukanlah skor benchmark, melainkan validasi nyata.
Tim merancang protein baru menggunakan ESMFold2, lalu mengirimnya ke laboratorium untuk sintesis dan pengujian; sebagian besar desain berfungsi sesuai harapan.
Dari "prediksi" ke "desain" hingga "verifikasi", rantai ini berjalan lancar, sehingga nilai berpindah dari paper ke dunia nyata.

Sepenuhnya open source, itulah senjata utama terbesar
Senjata kompetitif paling tajam ESMFold2 adalah sepenuhnya open source dan tidak membatasi penggunaan komersial.
Makna strategis dari pilihan ini menjadi lebih jelas dalam konteks seluruh industri AI.
Meskipun AlphaFold memiliki database terbuka, AlphaFold3 memberlakukan pembatasan untuk penggunaan komersial pada awal peluncurannya.
Model prediksi interaksi protein yang diluncurkan tahun ini oleh Isomorphic Labs, anak perusahaan Google DeepMind, sepenuhnya bersifat tertutup.
Bacaan lanjutan: Google merilis 'AlphaFold 4', tidak lagi open source! Kinerja mengungguli generasi sebelumnya
Ahli biologi komputasi dari MIT, Ovchinnikov, secara langsung menekankan nilai open source, "Saya memperkirakan banyak orang akan sangat antusias untuk mencoba ESMFold2."
Efek pengungkit dari AI open-source telah terbukti sepenuhnya di lintasan model bahasa besar, dengan seri Llama dari Meta sebagai contoh terbaik.
Sebuah model open source yang cukup kuat untuk mendorong komunitas global mengembangkan, mengaplikasikan, dan menemukan penggunaan yang bahkan tidak terpikirkan oleh pengembang aslinya.
Kondisi di bidang protein AI lebih khusus, di seluruh dunia ada banyak laboratorium dan lembaga penelitian yang sangat membutuhkan alat prediksi struktur gratis dan tanpa batasan; bahkan model tertutup sekuat apa pun, jumlah pengguna yang dapat dijangkau tetap terbatas.
Biohub memilih untuk sepenuhnya bersifat open source, sejalan dengan strategi Meta dalam model bahasa besar.
Strategi Zuckerberg di bidang AI semakin jelas—menggunakan open source sebagai infrastruktur dan ekosistem sebagai parit pertahanan.

Rekan sesama ahli, apakah Anda membeli?
Respon akademis positif, tetapi sikap berhati-hati juga jelas.
Gemma Atkinson dari Universitas Lund, Swedia, menyebut ESM Atlas "seharusnya menjadi sumber daya luar biasa bagi biologi."

Christine Orengo dari University College London mengakui nilainya, tetapi menekankan bahwa hasil prediksi perlu diverifikasi secara independen.

Pertanyaan yang lebih tajam datang dari Martin Steinegger dari Universitas Nasional Seoul.

Dia khawatir tentang seberapa baik ESMFold2 berkinerja terhadap "struktur baru" yang sangat berbeda dari protein yang sudah diketahui.
Timnya sebelumnya menemukan bahwa versi pertama ESMFold tidak unggul dalam hal ini. Masalah ini masih belum terpecahkan untuk ESMFold2.
Ovchinnikov dari MIT memberikan penilaian paling tenang, bahwa ESM Atlas lebih cocok diposisikan sebagai pelengkap database AlphaFold.

Dia juga menunjukkan bahwa model tertutup Isomorphic Labs serta beberapa model open-source yang tidak langsung dapat dibandingkan dengan Biohub juga mencapai hasil setara.
Kepemimpinan ESMFold2 mungkin tidak sebesar yang diindikasikan oleh makalah tersebut.
Kehati-hatian ini justru mencerminkan persaingan di lintasan AI protein yang telah memanas.
Model-model dari berbagai sumber—open source, closed source, akademik, dan komersial—sedang mengalami iterasi dengan kecepatan sangat tinggi.
Yang terkuat hari ini, enam bulan kemudian mungkin sudah tergantikan. Ritme ini sudah sangat mirip dengan perlombaan senjata di lintasan model bahasa besar.
Ketika AI mulai membaca kode sumber kehidupan
Dulu, menentukan struktur tiga dimensi sebuah protein bisa memakan waktu beberapa bulan hingga beberapa tahun kerja laboratorium.
AlphaFold pertama kali membuktikan bahwa AI dapat melakukannya dalam beberapa menit.
Sekarang ESMFold2 mendorong skala prediksi ke level 1 miliar, mencakup sejumlah besar protein yang sebelumnya belum pernah diuraikan.
Mengikuti jalur ini terus maju, ketika AI mampu memprediksi struktur semua protein dengan akurat, merancang protein fungsional baru yang diverifikasi secara eksperimen efektif, maka penerapan AGI di bidang ilmu kehidupan mungkin lebih dekat daripada yang diperkirakan kebanyakan orang.
Jika ASI benar-benar tiba, biologi baginya bukan lagi disiplin yang perlu diteliti, tetapi sistem yang dapat direkayasa.
Merancang kehidupan pada tingkat molekuler, membuat protein sesuai kebutuhan, menulis ulang aturan evolusi.
Ini terdengar seperti fiksi ilmiah, tetapi alat-alat seperti ESMFold2 sedang secara bertahap mengubah "fiksi ilmiah" menjadi "masalah teknis".
Hari ini, 1,1 miliar struktur protein dibuka di atas meja, tersedia secara gratis bagi semua ilmuwan di seluruh dunia yang memiliki koneksi internet.
Ini berarti kemampuan AI untuk memahami kehidupan telah naik ke tingkat yang lebih tinggi.
Referensi: https://www.nature.com/articles/d41586-026-01686-3
Artikel ini berasal dari akun WeChat "Sinzhiyuan", penulis: ASI Revelation; editor: Marco
