แอปเปิลเปิดตัวกรอบงาน Core AI ใหม่ที่ WWDC แทนที่ Core ML ที่ใช้งานมานาน 9 ปี โดยเขียนใหม่ตั้งแต่บรรทัดแรกเพื่อรองรับยุคโมเดลขนาดใหญ่

ผู้เขียนบทความ แหล่งที่มา: ซินจื้อหยวน

WWDC ครั้งสุดท้ายของ Cook ได้พลิกพื้นฐาน AI ของ Apple ไปแล้ว

แอปเปิลตัดฟีเจอร์ Core ML ที่ใช้งานมานาน 9 ปีออกทันที และแทนที่ด้วย Core AI ที่เขียนใหม่ตั้งแต่บรรทัดแรกเพื่อรองรับโมเดลขนาดใหญ่

Apple วาดเส้นเดียวกันให้กับ AI ทั้งหมด

Core AI ใหม่เป็นกรอบงานการอนุมาน AI ฝั่งปลายที่ Apple ออกแบบมาโดยเฉพาะสำหรับยุคโมเดลขนาดใหญ่

มันจัดการแบบรวมศูนย์สำหรับชิป CPU, GPU และ Neural Engine รองรับความสามารถพื้นฐานของ LLM อย่างการสร้างแบบอัตโนมัติ การตอบสนองแบบสตรีมมิ่ง และการสนทนาหลายรอบ ครอบคลุมทุกแพลตฟอร์มตั้งแต่ iOS 27, macOS 27 จนถึง watchOS 27

พูดแบบง่ายๆ Core ML ใช้สำหรับการเรียนรู้ของเครื่องแบบดั้งเดิม ส่วน Core AI ใช้สำหรับโมเดลขนาดใหญ่

ในขณะเดียวกัน ชุดเครื่องมือที่เกี่ยวข้องได้รับการปรับปรุงใหม่ทั้งหมด

รูปแบบโมเดล .aimodel ใหม่ พร้อมชุดเครื่องมือแปลง coreai-torch ที่ Apple เปิดซอร์ส บวกกับฟีเจอร์การปรับแต่งประสิทธิภาพและการคอมไพล์ล่วงหน้าใน Xcode ครอบคลุมทั้งกระบวนการตั้งแต่การแปลงโมเดลจนถึงการปรับใช้และเผยแพร่

ตัวอย่างแอปเรียนภาษา

นักเรียนยกโทรศัพท์ขึ้นชี้ไปที่นกฮัมมิงเบิร์ด SAM3 ทำงานสองอย่างพร้อมกันบนอุปกรณ์ ระบุว่าวัตถุในภาพคือ “Hummingbird” และแยกนกฮัมมิงเบิร์ดออกจากพื้นหลังอย่างแม่นยำ เพื่อสร้างรูปภาพการ์ดที่สะอาดตา

จากนั้น โมเดล Qwen ขนาด 0.6B พารามิเตอร์ จะรับผิดชอบส่วนข้อความ โดยใช้ผลการรับรู้เพื่อสร้างบัตรคำที่มีโครงสร้าง ประกอบด้วยสามฟิลด์: คำจีน ความหมายภาษาอังกฤษ และตัวอย่างประโยค โดยแต่ละฟิลด์จะถูกจัดวางอย่างถูกต้อง และส่งคืนเป็นชนิดพื้นฐานของ Swift ไม่ใช่ข้อความที่ต้องแยกวิเคราะห์อีก

กระบวนการทั้งหมดไม่เชื่อมต่ออินเทอร์เน็ต ไม่เรียกใช้ API ทำงานทั้งหมดบนโทรศัพท์มือถือเท่านั้น

เบื้องหลังสิ่งนี้คือ repository coreai-models ที่ Apple ดูแลอย่างเป็นทางการ ซึ่งเก็บโมเดลโอเพ่นซอร์สที่ได้รับการปรับแต่งล่วงหน้า เช่น Qwen, Mistral, SAM3 ทั้งหมดได้รับการปรับให้เข้ากับ Apple Silicon นักพัฒนาสามารถดึงลงมาและรันได้ในแอปของตนเองด้วยรหัส Swift เพียงไม่กี่บรรทัด

หากไม่ต้องการใช้แบบที่มีอยู่แล้ว คุณก็สามารถใช้โมเดลของตัวเองได้

แอปเปิลได้ซิงค์เครื่องมือ coreai-torch บน GitHub ในรูปแบบโอเพ่นซอร์ส สามารถแปลงโมเดล PyTorch ให้เป็นรูปแบบ .aimodel ได้ด้วยเพียง 5 บรรทัดของ Python แล้วนำเข้าไปคอมไพล์และปรับใช้ใน Xcode

ที่อยู่โครงการ:

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

อย่างไรก็ตาม แอปเปิลไม่ได้ต้องการแค่รันโมเดล แต่ต้องการรวมโมเดลทั้งหมดเข้าด้วยกัน

ในเชิงเทคนิค นั่นคือโปรโตคอล Language Model ที่เพิ่มเข้ามาในกรอบework Foundation Models มันกำหนด API แบบ Swift ที่เป็นมาตรฐานเดียวกัน ซึ่งโมเดลใดก็ตามที่ปฏิบัติตามจะสามารถเรียกใช้งานผ่านโค้ดชุดเดียวกันได้

โมเดลฝั่งปลายทางของแอปเปิลปฏิบัติตามโปรโตคอลนี้ โมเดลโอเพนซอร์สที่ทำงานบน Core AI ก็ปฏิบัติตามโปรโตคอลนี้ และโมเดลขนาดใหญ่บนคลาวด์เช่น Claude และ Gemini ก็ปฏิบัติตามโปรโตคอลนี้

รหัสชุดเดียว สามโมเดล สลับได้อย่างไร้รอยต่อจากท้องถิ่นสู่คลาวด์ แอปเปิลเปลี่ยนตัวเองเป็นชั้นการกำหนดเส้นทางของ AI

หน่วยความจำในโทรศัพท์มือถือซ่อนโมเดลขนาด 20,000 ล้าน

ที่ทำงานภายใต้กรอบงาน Foundation Models คือครอบครัวโมเดลที่พัฒนาขึ้นเองรุ่นที่สามของแอปเปิลและกูเกิล ชื่อ AFM 3 ซึ่งเปิดตัวโมเดลทั้งหมด 5 ตัวในครั้งเดียว

ด้านปลายสองอัน:

1. AFM 3 Core เป็นโมเดลหนาแน่นที่มีพารามิเตอร์ 3B รับผิดชอบงานเบาประจำวัน;

2. AFM 3 Core Advanced เป็นโมเดลแบบกระจายที่มีพารามิเตอร์ 20B ซึ่งเป็นขีดจำกัดสูงสุดบนอุปกรณ์ของแอปเปิล

สามในคลาวด์:

1. AFM 3 Cloud เป็นเซิร์ฟเวอร์หลัก;

2. ADM 3 Cloud เชี่ยวชาญในการสร้างและแก้ไขภาพ (ซึ่งเป็นเทคโนโลยีที่อยู่เบื้องหลัง Image Playground)；

3. AFM 3 Cloud Pro แข็งแกร่งที่สุดในครอบครัว

ในจำนวนนี้ เครื่องมือหลักฝั่งปลายทางคือ AFM 3 Core Advanced โมเดลขนาด 20,000 ล้านพารามิเตอร์ ที่สามารถรันได้โดยตรงบนโทรศัพท์มือถือ

ตามหลักทั่วไป หน่วยความจำของโทรศัพท์มือถือไม่สามารถจุข้อมูลขนาดนี้ได้ โมเดลขนาดใหญ่แบบดั้งเดิมต้องการให้พารามิเตอร์ทั้งหมดอยู่ใน DRAM ซึ่งพารามิเตอร์ 20,000 ล้านตัวยังยากต่อการจัดการแม้แต่บนอุปกรณ์ระดับเดสก์ท็อป

สำหรับเรื่องนี้ วิธีแก้ไขของแอปเปิลเรียกว่า Instruction-Following Pruning

โมเดลเต็มรูปแบบถูกเก็บไว้ในหน่วยความจำแฟลช (NAND) เมื่อได้รับคำขอ โมดูลการเรียกใช้งานแบบเบาจะเลือกผู้เชี่ยวชาญที่ต้องเปิดใช้งานก่อน แล้วโหลดน้ำหนักส่วนนั้นลงใน DRAM ปริมาณพารามิเตอร์ที่ใช้งานจริงในแต่ละครั้งอยู่ระหว่าง 1 พันล้านถึง 4 พันล้าน ขึ้นอยู่กับความซับซ้อนของงาน

โมเดลขนาด 20 พันล้านพารามิเตอร์ เมื่อทำงานจะใช้เพียง 5% ถึง 20% เท่านั้น ส่วนที่เหลือจะนิ่งอยู่ในหน่วยความจำแฟลชรอคำสั่ง

ที่คลาวด์นี้คือรุ่นเซิร์ฟเวอร์ที่ทรงพลังที่สุดของแอปเปิล—AFM 3 Cloud Pro

เพื่อพิชิตการวิเคราะห์เชิงซ้อนและการเรียกใช้เครื่องมือ Agent Apple ร่วมมือกับ Google และ NVIDIA ขยาย Private Cloud Compute ไปยัง GPU ของ NVIDIA บน Google Cloud กฎความเป็นส่วนตัวยังคงเหมือนเดิม ข้อมูลไม่ออกนอกขอบเขต

ผลการทดสอบจริงก็ยืนยันประสิทธิภาพของสถาปัตยกรรมชุดนี้

AFM 3 Core ถูกประเมินว่าดีกว่ารุ่นก่อนหน้าใน 45.6% ของ prompt ที่ทดสอบ ในขณะที่รุ่นก่อนหน้ามีอัตราความได้เปรียบเพียง 23.3% ส่วน AFM 3 Cloud บนคลาวด์มีช่องว่างที่มากยิ่งขึ้น คือ 64.7% เทียบกับ 8.7% แทบจะเป็นการกดขี่อย่างเดียวดาย

ได้อธิบายโครงสร้างและคะแนนไปแล้ว ตอนนี้มาถึงคำถามที่นักพัฒนาสนใจที่สุด: ระบบนี้ต้องใช้เงินเท่าไหร่

หากแอปของคุณมีจำนวนการดาวน์โหลดครั้งแรกต่ำกว่า 2 ล้านครั้งใน App Store การประมวลผลแบบคลาวด์ของ Private Cloud Compute จะฟรีสมบูรณ์ ไม่มีค่า API หรือค่า token คุณแค่เขียนแอปให้เสร็จแล้วมาเลย

สามารถพูดได้ว่าขีดจำกัดนี้อยู่ในตำแหน่งที่เหมาะสมสำหรับนักพัฒนาอิสระและทีมขนาดเล็กถึงกลาง

สามบรรทัดของรหัส คลอดเข้าโต๊ะ

ในบริบทของการปรับใช้จากบุคคลที่สามที่เปิดเผยต่อสาธารณะ Anthropic เป็นรายแรกที่ส่งงาน

ในวันที่ 8 มิถุนายน วันเดียวกับที่งาน WWDC Keynote สิ้นสุดลง Anthropic ได้เปิดตัว Swift Package อย่างเป็นทางการเพื่อเชื่อมต่อกับ Framework Foundation Models ซึ่งจะใช้งานได้ตั้งแต่วันที่ 9 มิถุนายน

ความคิดนั้นง่ายมาก

โมเดลฝั่งปลายของแอปเปิลเชี่ยวชาญในงานเบาๆ เช่น การสรุป การดึงข้อมูล และการจัดหมวดหมู่ ความเร็วสูง ไม่ต้องเชื่อมอินเทอร์เน็ต และไม่มีค่าใช้จ่าย แต่เมื่อเผชิญกับความต้องการที่ซับซ้อน เช่น การให้เหตุผลหลายขั้นตอน การสร้างโค้ด หรือการค้นหาผ่านอินเทอร์เน็ต โมเดลฝั่งปลายจะไม่สามารถรับมือได้

แต่แพ็กเกจ Swift ของ Claudeกลับอยู่พอดีกับรอยต่อนี้

นักพัฒนาสามารถเรียกใช้โมเดลฝั่งปลายของแอปเปิลได้อย่างปกติภายในกรอบงาน Foundation Models เมื่อภารกิจเกินขีดจำกัดของฝั่งปลาย ระบบจะส่งคำขอไปยัง Claude อัตโนมัติ และผลลัพธ์จะถูกส่งกลับไปยังมุมมอง SwiftUI เดียวกันในรูปแบบสตรีม

ผู้ใช้ไม่รับรู้ถึงการสลับใดๆ ตลอดกระบวนการ สำหรับพวกเขา มันคือแอปเดียว

พูดอีกแบบคือ หากแอปบันทึกโน้ตหรือแอปเรียนรู้ที่คุณใช้ประจำๆ อยู่ดีๆ ก็ฉลาดขึ้นและสามารถช่วยวิเคราะห์เชิงความหมายข้ามเอกสารได้ นั่นอาจเป็นเพราะนักพัฒนาได้เชื่อมต่อแพ็กเกจนี้ไว้

ตัวอย่างเช่น แอปไดอารี่สามารถใช้โมเดลฝั่งปลายทางเพื่อสร้างคำใบ้สำหรับการเขียนรายวัน แต่เมื่อผู้ใช้ถามว่า “หัวข้อทั่วไปของไดอารี่ในช่วงไม่กี่เดือนที่ผ่านมาคืออะไร” การสรุปความหมายข้ามเวลาจะถูกส่งให้ Claude จัดการอัตโนมัติ

อย่างไรก็ตาม การวางกลยุทธ์ของ Anthropic ในระบบนิเวศของ Apple ไม่ได้หยุดเพียงแค่นี้

Claude Agent ได้รับการผสานรวมเข้ากับ Xcode 26.3 ตั้งแต่เดือนกุมภาพันธ์ปีนี้ เพื่อช่วยนักพัฒนาเขียนโค้ด รันการทดสอบ และทำอัตโนมัติ

แต่ใน Xcode Claude ออกแบบมาสำหรับนักพัฒนาเอง ในขณะที่ Claude ใน Foundation Models ออกแบบมาสำหรับผู้ใช้สุดท้ายของแอป

สำหรับ Anthropic นี่คือบัตรเข้าชมระดับผู้บริโภคที่ล่าช้าแต่มีความสำคัญ

Claude ได้รับความนิยมอย่างมากในตลาดนักพัฒนาและองค์กร แต่แทบไม่มีการรับรู้จากผู้บริโภคทั่วไป

ครั้งนี้ โครงสร้างพื้นฐานของแอปเปิลได้ให้ทางเข้าถึงผู้ใช้ระดับพันล้านคน

อุปกรณ์ 2.5 พันล้านชิ้น หนึ่งเวทีการแข่งขัน

ย้อนดูการกระทำทั้งหมดของคุกใน WWDC รุ่นสุดท้ายของเขา สายใยหนึ่งเชื่อมโยงทั้งหมดไว้

แอปเปิลไม่ต้องการเป็นบริษัทโมเดล AI มันมอบสมองของ Siri ให้กับกูเกิล มอบ runtime ของโมเดลโอเพนซอร์สให้กับ Core AI และมอบสิทธิ์ในการเลือก AI จากบุคคลที่สามให้กับผู้ใช้

สิ่งที่มันต้องทำคือเวที

อุปกรณ์ 2.5 พันล้านเครื่อง โปรโตคอล Language Model แบบเดียวกัน โครงสร้างการจัดการแบบครบวงจรตั้งแต่ขอบจนถึงคลาวด์

ผู้ที่มีโมเดลที่ดีที่สุดจะสามารถเข้าถึงกลุ่มผู้ใช้คุณค่าสูงที่ใหญ่ที่สุดในโลกผ่านแพลตฟอร์มนี้

การแข่งขันระหว่างผู้นำด้านปัญญาประดิษฐ์ได้รับมิติใหม่ที่สมบูรณ์แบบตั้งแต่วันนี้

ก่อนหน้านี้ Anthropic และ OpenAI แข่งขันกันในเรื่องปริมาณการเรียกใช้ API เครื่องมือสำหรับนักพัฒนา และสัญญาขององค์กร

ตอนนี้แอปเปิลได้นำสนามการแข่งขันมาไว้ในกระเป๋าของทุกคน ผู้ใดสามารถครองตำแหน่ง “เครื่องยนต์ AI ค่าเริ่มต้น” ผู้นั้นจะชนะรอบถัดไป

วันที่ 1 กันยายน จอห์น เทอร์นัส รับตำแหน่งซีอีโอของแอปเปิล เขาสืบทอดไม่เพียงแต่บริษัทฮาร์ดแวร์ แต่ยังรวมถึงเวที AI ที่คุกได้สร้างไว้

Apple เปิดตัวกรอบงาน AI หลักที่ WWDC แทนที่ Core ML หลังจาก 9 ปี

Apple วาดเส้นเดียวกันให้กับ AI ทั้งหมด

หน่วยความจำในโทรศัพท์มือถือซ่อนโมเดลขนาด 20,000 ล้าน

สามบรรทัดของรหัส คลอดเข้าโต๊ะ

อุปกรณ์ 2.5 พันล้านชิ้น หนึ่งเวทีการแข่งขัน