AlphaFold tahtası tehlikede!
Nature makalesi: Zuckerberg'ın Biohub'u, AlphaFold veritabanından 8 milyar fazla olmak üzere 1,1 milyar protein yapısı tahmini yayınladı.
Arka plandaki AI modeli ESMFold2, AlphaFold3'ü tüm yönleriyle aşan performansa sahip olarak tanıtılmaktadır.
Daha da önemlisi, tamamen açık kaynaklı ve ticari kullanım için sınırlı değildir.

https://www.nature.com/articles/d41586-026-01686-3
Google DeepMind'in yıllardır inşa ettiği protein AI üstünlüğü, bir açık kaynak müsabikeler tarafından sarsılıyor.
Protein AI yarışmasının dengesi yeniden yazılabilir.
1,1 milyar protein yapısı, hemen servise hazır
27 Mayıs'ta Zuckerberg çifti tarafından kurulan biyomedikal kurum Biohub, ESM Atlas adlı bir protein yapısı veritabanını resmen yayınladı.
1,1 milyar tahmin edilen protein yapısı ve 6,8 milyar protein dizisi bilgisi.
AlphaFold veritabanı, 200 milyondan fazla yapı tahmini biriktirdi, ESM Atlas ise hemen 800 milyon ekledi.
Bu tahminleri oluşturan AI modeli, Biohub bilimsel sorumlusu Alex Rives liderliğinde geliştirilen ESMFold2'dir.

Rives şunları söylüyor:
Bu grafik, özellikle en az bilinen kısımlarıyla protein biyolojisinin tamamını göstermektedir.
Protein yapı tahmini neden önemlidir?
Proteinler, yaşamın çalışmasının temel parçalarıdır; şeklini bilmek, işlevini anlamayı ve yeni ilaçlar tasarlamayı, hastalıkları yenmeyi mümkün kılar.
AlphaFold, bu sayede Nobel Kimya Ödülü'nü kazandı ve AI'nın bilimi değiştirmesinin sembolik bir örneğidir.
Şimdi yeni bir model, 5 kat daha büyük bir veri setiyle ortaya çıktı.
ESMFold2'nin AI modeli olarak güçlü yönleri nelerdir?
ESMFold2, AlphaFold'dan farklı bir teknik yol izledi.
2024 yılında yayınlanan «Protein Dil Modeli» üzerine kurulmuştur ve temel fikir, NLP alanındaki yaklaşımlardan esinlenerek protein dizilerini «dil» gibi anlamak, milyarlarca protein verisi üzerinde eğiterek modelin diziden doğrudan üç boyutlu yapıyı tahmin etmesini sağlamaktır.
AlphaFold'in AI eşleri burayı gördüğünde bunun büyük dil modellerinin insan dilini öğrenme mantığıyla aynı olduğunu düşünecektir.
Eğitim verilerinin kapsama alanı kritik bir değişkendir.
ESMFold2, AlphaFold veritabanında boş olan toprak, deniz ve diğer çevrelerden gelen mikrobiyal protein verilerini büyük ölçüde dahil etti.
Daha geniş kapsamlı olmakla, modelin gördüğü «protein dünyası» daha tamamlanır.
Biohub ekibi, ESMFold2'nin proteinler arasındaki etkileşimlerin karma yapılarını tahmin etmede AlphaFold3'ten daha iyi performans gösterdiğini belirtti.
Ancak en ikna edici olan puanlama değil, uygulama doğrulamasıdır.
Takım, ESMFold2 ile tamamen yeni proteinler tasarladı, laboratuvarlarda sentezlenip test edildi ve tasarımın büyük bir oranı beklendiği gibi çalıştı.
"Tahmin"den "tasarım"a ve ardından "doğrulama"ya kadar bu zincir başarıyla çalıştırıldığında, değer makalelerden gerçek dünyaya yayılır.

Tamamen açık kaynaklı olmak, en büyük silahtır
ESMFold2'nin en keskin rekabet silahı, tamamen açık kaynaklı ve ticari kullanım için sınırsızdır.
Bu seçimin stratejik önemi, tüm AI endüstrisi bağlamında daha net görülür.
AlphaFold, açık bir veritabanına sahip olsa da, AlphaFold3 çıkış sırasında ticari kullanım için kısıtlamalar getirdi.
Google DeepMind'in Isomorphic Labs'ı bu yıl çıkardığı protein etkileşim tahmin modeli tamamen kapalı kaynaklıdır.
Daha fazla okuma: Google, 'AlphaFold 4'ü yayınladı, artık açık kaynak değil! Performansı önceki nesli ezip geçiyor
MIT'nin hesaplamalı biyologu Ovchinnikov, açık kaynakın değerini doğrudan vurguladı: "Çok sayı kişinin ESMFold2'yi denemek için heyecanla beklediğini tahmin ediyorum."
Açık kaynaklı AI'nın büyük dil modelleri alanında kaldıraç etkisi tamamen doğrulanmıştır; Meta'nın Llama serisi en iyi örnektir.
Küresel topluluğu, orijinal geliştiricilerin bile düşünmediği kullanım alanlarını geliştirmek, uygulamak ve keşfetmek için yeterince güçlü bir açık kaynak modeli.
Protein AI alanında durum daha özeldir; dünya çapında sayıca çok sayıda laboratuvar ve araştırma kurumu, ücretsiz ve sınırsız bir yapı tahmini aracına ihtiyaç duymaktadır; kapalı kaynak modelleri ne kadar güçlü olursa olsun, ulaşabileceği kullanıcı kümesi bu kadar sınırlıdır.
Biohub, tamamen açık kaynaklı hale gelerek Meta'nın büyük dil modellerindeki stratejisini sürdürüyor.
Zuckerberg ekibi, AI alanında stratejisi giderek daha netleşiyor — açık kaynakla altyapı oluşturmak, ekosistemle koruma duvarı inşa etmek.

Eş zamanlı uzmanlar, alım yapar mısınız?
Akademik çevrelerden olumlu tepkiler gelirken, tutumlar da net şekilde korunmuştur.
İsveç'teki Lund Üniversitesi'nden Gemma Atkinson, ESM Atlas'ın "biyoloji için harika bir kaynak olması gerektiğini" söyledi.

University College London'dan Christine Orengo, değeri kabul ediyor ancak tahmin sonuçlarının bağımsız olarak doğrulanması gerektiğini vurguluyor.

Seul Ulusal Üniversitesi'nden Martin Steinegger'den daha keskin bir soru geldi.

O, ESMFold2'nin bilinen proteinlerden çok farklı olan "yeni yapılar" karşısında nasıl performans gösterdiğini merak ediyor.
Takımı daha önce ESMFold'in birinci versiyonunun bu konuda iyi olmadığını keşfetti. Bu sorun, ESMFold2 için hâlâ çözülmedi.
MIT'nin Ovchinnikov'u, ESM Atlas'ın AlphaFold veritabanının tamamlayıcısı olarak daha uygun olduğunu en sakin şekilde değerlendirdi.

Ayrıca, Isomorphic Labs'in kapalı kaynak modelinin ve bazı Biohub'ların doğrudan karşılaştırılabilecek açık kaynak modelleri olmamasına rağmen benzer düzeyde sonuçlar elde ettiğini belirtti.
ESMFold2'nin öncülüğü, makalede ima edildiği kadar büyük olmayabilir.
Bu dikkatli yaklaşım, protein AI yarışının zirveye ulaştığını yansıtmaktadır.
Açık kaynak, kapalı kaynak, akademik ve ticari tüm modeller çok hızlı bir şekilde güncelleniyor.
Bugünün "en güçlüsü", altı ay sonra yenilenebilir. Bu tempoyla büyük dil modelleri yarışmasının silahlanma yarışıyla çok benzer hale geldi.
Yapay zekâ yaşamın kaynak kodunu okumaya başladığında
Geçmişte, bir proteinin üç boyutlu yapısını çözmek aylarca hatta yıllarca laboratuvar çalışması gerektirebilirdi.
AlphaFold, AI'nin dakikalar içinde yapabileceğini ilk kez kanıtladı.
ESMFold2, şimdi 1,1 milyar ölçeğinde tahminler yaparak daha önce çözülmeyen birçok proteini kapsamaktadır.
Bu yol boyunca ilerlendiğinde, AI'nın tüm protein yapılarını tam olarak tahmin edebilmesi, tamamen yeni fonksiyonel proteinler tasarlayabilmesi ve bu tasarımı deneysel olarak doğrulayabilmesi durumunda, AGI'nin yaşam bilimleri alanında uygulanması, çoğu kişinin tahmin ettiğinden daha yakın olabilir.
ASI gerçekten geldiğinde, biyoloji onun için "araştırılması" gereken bir disiplin değil, "mühendisliği" yapılabilecek bir sistem olacak.
Yaşamı moleküler düzeyde tasarlayın, isteğe bağlı olarak proteinler oluşturun, evrimin kurallarını yeniden yazın.
Bu bilim kurgu gibi geliyor, ancak ESMFold2 gibi araçlar "bilim kurguyu" adım adım "mühendislik sorunu" haline getiriyor.
Bugün, 1,1 milyar protein yapısı masanın üstünde serildi ve dünyadaki her ağ bağlantısı olan bilim insanı bunlara ücretsiz erişebilir.
Bu, AI'nın yaşamı anlama yeteneğinin bir üst seviyeye çıktığı anlamına gelir.
Kaynaklar: https://www.nature.com/articles/d41586-026-01686-3
Bu yazı, WeChat hesabından "Yeni Akıllı Dünya" tarafından paylaşılmıştır; yazar: ASI Vahiyleri; editör: Marko
