Biohub เปิดตัว ESM Atlas พร้อมโครงสร้างโปรตีน 11 พันล้านโครงสร้าง ท้าทาย AlphaFold

icon MarsBit
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
Biohub สถาบันวิจัยที่ก่อตั้งโดยมาร์ก ซัคเคอร์เบิร์ก ได้เปิดตัว ESM Atlas ฐานข้อมูลโปรตีนที่มีโครงสร้างที่คาดการณ์ไว้ 11 พันล้านโครงสร้างและลำดับ 68 พันล้านลำดับ โมเดล AI ESMFold2 อ้างว่ามีประสิทธิภาพดีกว่า AlphaFold3 และเปิดซอร์สสำหรับการใช้งานเชิงพาณิชย์ การพัฒนานี้อาจเปลี่ยนแปลงวงการ AI ด้านโปรตีน การเคลื่อนไหวนี้ได้กระตุ้นการอภิปรายในวงข่าว AI + crypto เกี่ยวกับการประยุกต์ใช้บนโซ่และการเชื่อมต่อข้อมูลใหม่ๆ

บัลลังก์ AlphaFold กำลังตกอยู่ในอันตราย!

Nature ตีพิมพ์บทความ: Biohub ของซัคเคอร์เบิร์กเปิดเผยการคาดการณ์โครงสร้างโปรตีน 1.1 พันล้านโครงสร้าง มากกว่าฐานข้อมูล AlphaFold 800 ล้านโครงสร้าง

โมเดล AI ด้านหลัง ESMFold2 อ้างว่ามีประสิทธิภาพเหนือกว่า AlphaFold3 อย่างครอบคลุม

ที่สำคัญกว่านั้น คือเปิดแหล่งที่มาอย่างสมบูรณ์ และไม่จำกัดการใช้งานเพื่อการค้า

ไบโอฮับ

https://www.nature.com/articles/d41586-026-01686-3

ตำแหน่งผู้นำด้าน AI สำหรับโปรตีนที่ Google DeepMind ได้ครองมานานหลายปี กำลังถูกคู่แข่งแบบโอเพ่นซอร์สท้าทาย

รูปแบบของสนามแข่งขันโปรตีน AI อาจต้องเขียนใหม่

โครงสร้างโปรตีน 1.1 พันล้านโครงสร้าง จัดเสิร์ฟเรียบร้อยแล้ว

วันที่ 27 พฤษภาคม สถาบันชีวการแพทย์ Biohub ที่ก่อตั้งโดยคู่สมรสซักเคอร์เบิร์ก ได้เปิดตัวฐานข้อมูลโครงสร้างโปรตีนชื่อ ESM Atlas อย่างเป็นทางการ

1.1 พันล้านโครงสร้างโปรตีนที่คาดการณ์ พร้อมข้อมูลลำดับโปรตีน 6.8 พันล้านลำดับ

ฐานข้อมูลของ AlphaFold มีการพยากรณ์โครงสร้างมากกว่า 200 ล้านโครงสร้าง ในขณะที่ ESM Atlas เพิ่มเข้ามาอีก 800 ล้านรายการ

โมเดล AI ที่สร้างการพยากรณ์เหล่านี้ชื่อ ESMFold2 ซึ่งพัฒนาโดยทีมนำโดย Alex Rives หัวหน้าฝ่ายวิทยาศาสตร์ของ Biohub

ไบโอฮับ

ริฟส์กล่าวว่า:

แผนภาพนี้แสดงภาพรวมของชีววิทยาของโปรตีน โดยเฉพาะส่วนที่ยังไม่เป็นที่รู้จักมากที่สุด

ทำไมการพยากรณ์โครงสร้างโปรตีนจึงสำคัญ?

โปรตีนเป็นชิ้นส่วนหลักที่ขับเคลื่อนชีวิต การรู้รูปร่างของมันจะช่วยให้เข้าใจฟังก์ชันของมัน ซึ่งนำไปสู่การพัฒนายาใหม่และการรักษาโรค

AlphaFold ได้รับรางวัลโนเบลสาขาเคมีจากสิ่งนี้ ซึ่งเป็นตัวอย่างสำคัญที่แสดงให้เห็นว่า AI เปลี่ยนแปลงวิทยาศาสตร์

ตอนนี้มีโมเดลใหม่ที่ใช้ชุดข้อมูลขนาดใหญ่กว่า 5 เท่าออกมา

ในฐานะโมเดล AI, ESMFold2 แข็งแกร่งตรงไหน

ESMFold2 ใช้แนวทางทางเทคนิคที่ต่างจาก AlphaFold

มันถูกสร้างขึ้นจาก «โปรตีนแลนกวีจีโมเดล» ที่เปิดตัวในปี 2024 โดยใช้แนวคิดหลักที่ยืมมาจากสาขา NLP ซึ่งมองลำดับโปรตีนเป็น «ภาษา» และฝึกโมเดลบนข้อมูลโปรตีนหลายพันล้านลำดับ เพื่อให้โมเดลเรียนรู้การคาดการณ์โครงสร้างสามมิติโดยตรงจากลำดับ

เพื่อนร่วมงานด้าน AI ของ AlphaFold น่าจะรู้สึกคุ้นเคยกับสิ่งนี้ เพราะมันมีตรรกะเดียวกับโมเดลภาษาขนาดใหญ่ที่เรียนรู้ภาษาของมนุษย์

ขอบเขตของข้อมูลการฝึกอบรมเป็นตัวแปรสำคัญ

ESMFold2 รวมข้อมูลโปรตีนของจุลินทรีย์จากสิ่งแวดล้อมต่างๆ เช่น ดินและทะเล ซึ่งเป็นช่องว่างในฐานข้อมูลของ AlphaFold

การครอบคลุมกว้างขึ้น ทำให้โมเดลเห็นโลกของโปรตีนได้สมบูรณ์ยิ่งขึ้น

ทีม Biohub ระบุว่า ESMFold2 แสดงประสิทธิภาพที่ดีกว่า AlphaFold3 ในการทำนายโครงสร้างคอมเพล็กซ์ของการโต้ตอบระหว่างโปรตีน

แต่สิ่งที่น่าเชื่อถือที่สุดไม่ใช่คะแนนทดสอบ แต่คือการยืนยันในทางปฏิบัติ

ทีมงานออกแบบโปรตีนใหม่ด้วย ESMFold2 แล้วส่งไปสังเคราะห์และทดสอบในห้องปฏิบัติการ ซึ่งการออกแบบส่วนใหญ่ทำงานตามที่คาดไว้

จากการทำนาย ไปสู่การออกแบบ และสุดท้ายคือการยืนยัน สายเชื่อมนี้จะเชื่อมโยงคุณค่าจากบทความวิจัยสู่โลกแห่งความเป็นจริง

ไบโอฮับ

เปิดแหล่งที่มาทั้งหมด นี่คืออาวุธที่ทรงพลังที่สุด

ESMFold2 ที่ทรงพลังที่สุดคือเปิดแหล่งที่มาอย่างสมบูรณ์และไม่จำกัดการใช้งานเชิงพาณิชย์

ความหมายเชิงกลยุทธ์ของการเลือกนี้จะชัดเจนยิ่งขึ้นเมื่อพิจารณาในบริบทของอุตสาหกรรม AI ทั้งหมด

แม้ว่า AlphaFold จะมีฐานข้อมูลเปิด แต่ AlphaFold3 ได้จำกัดการใช้งานเชิงพาณิชย์ในช่วงเริ่มต้นของการเปิดตัว

Isomorphic Labs ซึ่งเป็นบริษัทในเครือของ Google DeepMind ได้เปิดตัวโมเดลการทำนายการโต้ตอบของโปรตีนในปีนี้ โดยเป็นแบบปิดแหล่งที่มาอย่างสมบูรณ์

อ่านเพิ่มเติม: กูเกิลเปิดตัว「AlphaFold 4」แล้ว ไม่เปิดซอร์สโค้ดอีกต่อไป! ประสิทธิภาพเหนือรุ่นก่อนหน้า

นักชีววิทยาคำนวณจาก MIT ชื่อ Ovchinnikov ได้ชี้ให้เห็นถึงคุณค่าของการเปิดแหล่งที่มาโดยตรงว่า “ฉันคาดว่าหลายคนจะตื่นเต้นที่จะลองใช้ ESMFold2”

ผลกระทบของเลเวอเรจจาก AI แบบโอเพนซอร์สได้รับการพิสูจน์อย่างเต็มที่ในเส้นทางโมเดลภาษาขนาดใหญ่ โดยซีรีส์ Llama ของ Meta เป็นตัวอย่างที่ดีที่สุด

โมเดลโอเพ่นซอร์สที่แข็งแรงพอที่จะดึงชุมชนทั่วโลกให้มาพัฒนา ใช้งาน และค้นพบการใช้งานที่นักพัฒนาต้นฉบับไม่เคยคิดถึง

สถานการณ์ในด้านโปรตีน AI นั้นพิเศษกว่ามาก มีห้องปฏิบัติการและสถาบันวิจัยจำนวนมากทั่วโลกที่เร่งต้องการเครื่องมือทำนายโครงสร้างแบบฟรีและไม่มีข้อจำกัด แม้โมเดลแบบปิดจะแข็งแกร่งเพียงใด ก็ยังเข้าถึงผู้ใช้ได้จำกัด

Biohub ตัดสินใจเปิดแหล่งที่มาอย่างครบถ้วน ซึ่งสอดคล้องกับกลยุทธ์ของ Meta ในการพัฒนาโมเดลภาษาขนาดใหญ่

กลยุทธ์ของซัคเคอร์เบิร์กในโดเมน AI กำลังชัดเจนขึ้นเรื่อยๆ — ใช้โอเพ่นซอร์สเป็นโครงสร้างพื้นฐาน และใช้ระบบนิเวศเป็นกำแพงป้องกัน

ไบโอฮับ

เพื่อนร่วมวงการผู้เชี่ยวชาญ คุณจะซื้อหรือไม่?

ปฏิกิริยาจากวงการวิชาการเป็นไปในทางบวก แต่ความเห็นสงวนไว้ก็ชัดเจนเช่นกัน

เจมมา อัตคินสัน จากมหาวิทยาลัยลุนด์ ประเทศสวีเดน กล่าวว่า ESM Atlas «ควรเป็นทรัพยากรที่ยอดเยี่ยมสำหรับชีววิทยา»

ไบโอฮับ

Christine Orengo จาก University College London ยอมรับคุณค่าของมัน แต่เน้นย้ำว่าผลลัพธ์การพยากรณ์ต้องได้รับการตรวจสอบอย่างเป็นอิสระ

ไบโอฮับ

คำถามที่แหลมคมกว่านั้นมาจาก มาร์ติน สไตน์เกกเกอร์ แห่งมหาวิทยาลัยแห่งชาติโซล

ไบโอฮับ

เขาสนใจว่า ESMFold2 จะแสดงผลอย่างไรเมื่อเผชิญกับ "โครงสร้างใหม่" ที่แตกต่างอย่างมากจากโปรตีนที่รู้จัก

ทีมของเขาเคยพบว่ารุ่นแรกของ ESMFold ไม่โดดเด่นในด้านนี้ ปัญหานี้ยังคงไม่ได้รับการแก้ไขสำหรับ ESMFold2

โอวชินนิคอฟจาก MIT ให้การตัดสินที่สงบเย็นที่สุด โดยเขาเชื่อว่า ESM Atlas เหมาะสมกว่าที่จะถูกกำหนดให้เป็นส่วนเสริมของฐานข้อมูล AlphaFold

ไบโอฮับ

เขายังชี้ให้เห็นว่า โมเดลแบบปิดของ Isomorphic Labs และบางโมเดลของ Biohub ที่ไม่มีโมเดลแบบเปิดให้เปรียบเทียบโดยตรง ก็บรรลุผลลัพธ์ในระดับที่คล้ายกัน

ความได้เปรียบของ ESMFold2 อาจไม่ใหญ่เท่าที่บทความระบุไว้

ความระมัดระวังนี้สะท้อนให้เห็นว่าการแข่งขันในเส้นทางโปรตีน AI ได้รุนแรงขึ้นอย่างมาก

โมเดลจากทุกประเภท—โอเพนซอร์ส ปิดซอร์ส ทางวิชาการ และเชิงพาณิชย์—กำลังพัฒนาอย่างรวดเร็วมาก

วันนี้ “ที่สุด” อาจถูกทับถมอีกครั้งภายในหกเดือน จังหวะนี้คล้ายกับการแข่งขันอาวุธในวงการโมเดลภาษาขนาดใหญ่มาก

เมื่อ AI เริ่มอ่านรหัสต้นกำเนิดของชีวิต

ในอดีต การวิเคราะห์โครงสร้างสามมิติของโปรตีนหนึ่งชนิดอาจใช้เวลาหลายเดือนถึงหลายปีในการทำงานในห้องปฏิบัติการ

AlphaFold แสดงให้เห็นเป็นครั้งแรกว่า AI สามารถทำได้ในไม่กี่นาที

ปัจจุบัน ESMFold2 ได้ผลักดันขอบเขตการพยากรณ์ไปถึงระดับ 1.1 พันล้าน ครอบคลุมโปรตีนจำนวนมากที่ก่อนหน้านี้ยังไม่เคยถูกวิเคราะห์

หากพิจารณาไปในทิศทางนี้ เมื่อ AI สามารถทำนายโครงสร้างของโปรตีนทั้งหมดได้อย่างแม่นยำ ออกแบบโปรตีนใหม่ที่มีฟังก์ชันเฉพาะ และยืนยันผ่านการทดลองว่ามีประสิทธิภาพ ระยะทางสู่การประยุกต์ใช้ AGI ในสาขาชีววิทยาศาสตร์อาจใกล้กว่าที่คนส่วนใหญ่คาดไว้

หาก ASI มาถึงจริง ชีววิทยาจะไม่ใช่อีกต่อไปซึ่งเป็นสาขาวิชาที่ต้องทำการ “ศึกษา” แต่จะกลายเป็นระบบที่สามารถ “วิศวกรรม” ได้

ออกแบบชีวิตในระดับโมเลกุล สร้างโปรตีนตามความต้องการ เขียนใหม่กฎแห่งวิวัฒนาการ

ฟังดูเหมือนวิทยาศาสตร์แฟนตาซี แต่เครื่องมือเช่น ESMFold2 กำลังค่อยๆ เปลี่ยน “วิทยาศาสตร์แฟนตาซี” ให้กลายเป็น “ปัญหาด้านวิศวกรรม”

วันนี้ โครงสร้างของโปรตีน 1.1 พันล้านโครงสร้างถูกเปิดเผยบนโต๊ะ นักวิทยาศาสตร์ทั่วโลกที่มีการเชื่อมต่ออินเทอร์เน็ตสามารถเข้าถึงได้ฟรี

นั่นหมายความว่า ความสามารถของ AI ในการเข้าใจชีวิตได้ก้าวขึ้นอีกขั้น

ข้อมูลอ้างอิง: https://www.nature.com/articles/d41586-026-01686-3

บทความนี้มาจากหมายเลขเวิชช่อง WeChat “ซินจีหยวน” โดยผู้เขียน: ASI Revelation; บรรณาธิการ: มาโก

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา