Apple ra mắt khung Core AI mới tại WWDC, thay thế Core ML đã hoạt động 9 năm, được viết lại từ dòng mã đầu tiên dành riêng cho thời đại mô hình lớn.

Tác giả bài viết, nguồn: Newzhong

WWDC lần cuối của Cook đã lật đổ nền tảng AI của Apple.

Apple đã loại bỏ hoàn toàn Core ML sau 9 năm sử dụng, và Core AI thay thế nó được viết lại từ dòng mã đầu tiên dành riêng cho các mô hình lớn.

Apple đã vẽ cùng một đường cho tất cả các AI

Core AI mới hoàn toàn là khung suy luận AI phía thiết bị do Apple thiết kế riêng cho thời đại mô hình lớn.

Nó điều phối đồng bộ ba chip CPU, GPU và Neural Engine, hỗ trợ native các khả năng cơ bản của LLM như sinh tự hồi, phản hồi luồng và hội thoại đa vòng, phủ sóng toàn bộ nền tảng từ iOS 27, macOS 27 đến watchOS 27.

Nói một cách đơn giản, Core ML dùng cho máy học truyền thống, còn Core AI dùng cho các mô hình lớn.

Meanwhile, the accompanying toolchain has been completely rebuilt.

Định dạng mô hình .aimodel mới, bộ công cụ chuyển đổi coreai-torch do Apple mã nguồn mở, cộng với các tính năng tối ưu hiệu năng và biên dịch trước trong Xcode, bao phủ toàn bộ quy trình từ chuyển đổi mô hình đến triển khai và đưa lên nền tảng.

Ví dụ về một ứng dụng học ngôn ngữ.

Học sinh cầm điện thoại chĩa vào một con chim ruồi, SAM3 đồng thời thực hiện hai việc tại thiết bị đầu cuối: nhận diện đối tượng trong khung hình là «Hummingbird» và tách chính xác chim ruồi ra khỏi nền, tạo ra một hình ảnh thẻ sạch sẽ.

Sau đó, một mô hình Qwen với 0,6B tham số sẽ đảm nhận phần văn bản, sử dụng kết quả nhận dạng để tạo một thẻ từ vựng có cấu trúc với ba trường: từ tiếng Trung, định nghĩa tiếng Anh và ví dụ, trả về một kiểu dữ liệu bản địa của Swift, không phải một chuỗi văn bản cần phân tích thêm.

Toàn bộ quy trình không kết nối internet, không gọi API, chạy hoàn toàn trên điện thoại di động.

Đằng sau điều này là kho lưu trữ coreai-models do Apple duy trì, chứa các mô hình nguồn mở đã được tối ưu trước như Qwen, Mistral, SAM3, tất cả đều được điều chỉnh phù hợp với Apple Silicon. Các nhà phát triển chỉ cần tải về và vài dòng mã Swift là có thể chạy chúng ngay trong ứng dụng của mình.

Nếu không muốn dùng mẫu có sẵn, bạn cũng có thể sử dụng mô hình của riêng mình.

Apple đã đồng bộ hóa công cụ coreai-torch trên GitHub, chỉ với 5 dòng Python, bạn có thể chuyển đổi một mô hình PyTorch sang định dạng .aimodel và đưa vào Xcode để biên dịch và triển khai.

Địa chỉ dự án:

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

Tuy nhiên, Apple không chỉ muốn chạy mô hình, mà còn muốn thống nhất tất cả các mô hình.

Về mặt kỹ thuật, đó là giao thức Language Model được thêm vào trong khung Foundation Models. Nó định nghĩa một bộ API Swift thống nhất, bất kỳ mô hình nào tuân theo nó đều có thể được gọi bằng cùng một đoạn mã.

Mô hình đầu cuối của Apple tuân theo giao thức này, các mô hình mã nguồn mở chạy trên Core AI tuân theo giao thức này, và các mô hình lớn trên đám mây như Claude và Gemini cũng tuân theo giao thức này.

Một bộ mã, ba mô hình, chuyển đổi liền mạch từ cục bộ đến đám mây. Apple đã tự biến mình thành lớp định tuyến AI.

Bộ mô hình 20 tỷ được giấu trong bộ nhớ flash của điện thoại

Chạy trên nền tảng Foundation Models là gia đình mô hình tự phát triển thế hệ thứ ba do Apple và Google hợp tác phát triển, AFM 3, với 5 mô hình được ra mắt cùng lúc.

Hai bên đầu cuối:

1. AFM 3 Core là mô hình dày đặc với 3B tham số, phụ trách các tác vụ nhẹ hàng ngày;

2. AFM 3 Core Advanced là mô hình thưa có 20 tỷ tham số, giới hạn trên của thiết bị Apple.

Ba cái trên đám mây:

1. AFM 3 Cloud là máy chủ chính;

2. ADM 3 Cloud chuyên về tạo và chỉnh sửa hình ảnh (được sử dụng trong Image Playground);

3. AFM 3 Cloud Pro là mạnh nhất trong toàn bộ dòng sản phẩm.

Trong đó, công cụ mạnh mẽ phía thiết bị đầu cuối được gọi là AFM 3 Core Advanced, mô hình lớn với 20 tỷ tham số, chạy trực tiếp trên điện thoại di động.

Theo lý thông thường, bộ nhớ điện thoại không thể chứa khối lượng dữ liệu này. Các mô hình lớn truyền thống yêu cầu tất cả trọng số phải được lưu trong DRAM, 20 tỷ tham số đã khiến các thiết bị để bàn gặp khó khăn.

Đối với vấn đề này, giải pháp của Apple được gọi là Instruction-Following Pruning.

Mô hình đầy đủ được lưu trữ trong bộ nhớ flash (NAND). Sau khi nhận yêu cầu, một mô-đun định tuyến nhẹ sẽ chọn ra các chuyên gia cần kích hoạt, sau đó tải các trọng số tương ứng vào DRAM. Số lượng tham số được kích hoạt thực tế mỗi lần nằm trong khoảng từ 1 đến 4 tỷ, tùy thuộc vào độ phức tạp của nhiệm vụ.

Một mô hình với 20 tỷ tham số, khi hoạt động chỉ sử dụng 5% đến 20% trong số đó, phần còn lại yên lặng nằm trên bộ nhớ flash chờ được gọi đến.

Ở phía đám mây, đây là mô hình máy chủ mạnh nhất của Apple—AFM 3 Cloud Pro.

Để giải quyết các nhiệm vụ suy luận phức tạp và gọi công cụ Agent, Apple hợp tác với Google và NVIDIA, mở rộng Private Cloud Compute lên các GPU NVIDIA trên Google Cloud. Các quy tắc bảo mật vẫn được giữ nguyên, dữ liệu không ra khỏi vùng.

Actual test results also corroborate the effectiveness of this architecture.

AFM 3 Core được đánh giá vượt trội hơn thế hệ trước trên 45,6% các prompt kiểm tra, trong khi lợi thế của thế hệ trước chỉ là 23,3%. Trên đám mây, sự chênh lệch của AFM 3 Cloud còn lớn hơn nhiều, với 64,7% so với 8,7%, gần như áp đảo hoàn toàn.

Đã nói xong về kiến trúc và điểm số, giờ đến vấn đề mà các nhà phát triển quan tâm nhất: hệ thống này tốn bao nhiêu tiền?

Nếu lượt tải xuống đầu tiên của ứng dụng bạn trên App Store dưới 2 triệu, tính toán đám mây riêng tư hoàn toàn miễn phí, không mất chi phí API, không mất phí token. Bạn chỉ cần tập trung viết ứng dụng là xong.

Có thể nói, mức ngưỡng này chính xác nằm ở vị trí của các nhà phát triển độc lập và các nhóm vừa và nhỏ.

Ba dòng mã, Claude đã vào bàn

Trong các bản điều chỉnh bên thứ ba được công bố, Anthropic là người đầu tiên nộp bài.

Cùng ngày kết thúc sự kiện WWDC ngày 8 tháng 6, Anthropic đã ngay lập tức phát hành một gói Swift, chính thức tích hợp vào khung Foundation Models, có sẵn từ ngày 9 tháng 6.

Ý tưởng rất đơn giản.

Mô hình đầu cuối của Apple nổi bật trong các tác vụ nhẹ như tóm tắt, trích xuất thông tin và phân loại, với tốc độ nhanh, không cần kết nối internet và chi phí bằng không. Tuy nhiên, khi đối mặt với các yêu cầu phức tạp như suy luận đa bước, tạo mã hoặc tìm kiếm trực tuyến, mô hình đầu cuối không thể xử lý được.

Trong khi đó, gói Swift của Claude đã chính xác nằm ngay tại đường nối này.

Các nhà phát triển có thể gọi bình thường các mô hình đầu cuối của Apple trong khung Foundation Models; khi nhiệm vụ vượt quá khả năng đầu cuối, khung sẽ tự động định tuyến yêu cầu đến Claude, và kết quả phản hồi được trả về dưới dạng luồng vào cùng một SwiftUI view.

Người dùng không cảm nhận được sự chuyển đổi, đối với họ đây chỉ là một ứng dụng.

Nói cách khác, nếu một ứng dụng ghi chú hoặc học tập mà bạn thường dùng đột nhiên trở nên thông minh hơn, có thể thực hiện phân tích ngữ nghĩa xuyên tài liệu, thì rất có thể nhà phát triển đã tích hợp gói này.

Ví dụ: Một ứng dụng nhật ký có thể sử dụng mô hình đầu cuối để tạo gợi ý viết hàng ngày, nhưng khi người dùng hỏi “Những chủ đề chung của các bài nhật ký trong vài tháng qua là gì?”, thì việc tổng hợp ngữ nghĩa xuyên thời gian này sẽ tự động được giao cho Claude xử lý.

Tuy nhiên, nỗ lực của Anthropic trong hệ sinh thái Apple không chỉ dừng lại ở bước này.

Claude Agent đã được tích hợp vào Xcode 26.3 từ tháng 2 năm nay, hỗ trợ nhà phát triển viết mã, chạy kiểm thử và tự động hóa.

Nhưng Claude trong Xcode nhắm đến chính các nhà phát triển, trong khi Claude trong Foundation Models nhắm đến người dùng cuối của ứng dụng.

Đối với Anthropic, đây là một tấm vé vào thị trường tiêu dùng trễ hẹn nhưng vô cùng quan trọng.

Claude đã rất tích cực trên thị trường nhà phát triển và doanh nghiệp, nhưng gần như không có sự hiện diện nào trước người tiêu dùng phổ thông.

Lần này, khung nền tảng Foundation Models của Apple đã mang đến cho nó một kênh tiếp cận hàng tỷ người dùng.

2,5 tỷ thiết bị, một đấu trường

Xem lại toàn bộ các động thái của Cook tại WWDC cuối cùng, một đường nét xuyên suốt.

Apple không muốn trở thành công ty mô hình AI. Nó giao bộ não của Siri cho Google, giao thời gian chạy các mô hình mã nguồn mở cho Core AI, và trao quyền lựa chọn AI của bên thứ ba cho người dùng.

Nó cần làm là đấu trường.

2,5 tỷ thiết bị, giao thức Language Model thống nhất, khung lập lịch toàn diện từ thiết bị đầu cuối đến đám mây.

Ai có mô hình tốt hơn, người đó sẽ tiếp cận được nhóm người dùng giá trị cao nhất trên toàn cầu thông qua nền tảng này.

Cuộc cạnh tranh giữa các ông lớn AI đã thêm một chiều mới kể từ hôm nay.

Trước đây, Anthropic và OpenAI cạnh tranh về số lượng gọi API, công cụ phát triển và hợp đồng doanh nghiệp.

Bây giờ Apple đã mang cuộc chiến vào túi của mỗi người, ai chiếm được vị trí “động cơ AI mặc định” sẽ chiến thắng ván tiếp theo.

Ngày 1 tháng 9, John Ternus kế nhiệm vị trí CEO của Apple. Ông kế thừa không chỉ một công ty phần cứng, mà còn cả sân đấu AI mà Cook để lại.

Apple công bố khung AI cốt lõi tại WWDC, thay thế Core ML sau 9 năm

Apple đã vẽ cùng một đường cho tất cả các AI

Bộ mô hình 20 tỷ được giấu trong bộ nhớ flash của điện thoại

Ba dòng mã, Claude đã vào bàn

2,5 tỷ thiết bị, một đấu trường