Android, iOS, HarmonyOS và Windows bước vào thời kỳ đại lý với tích hợp AI cấp hệ điều hành

Bài viết | Yunyong AI, Tác giả | Hoàng Vân Hạo

一. Sau Google I/O 2026: Bốn hệ điều hành đầu cuối bước vào thời đại Agent

Vào ngày 12 tháng 5 năm 2026, Google đã tổ chức sự kiện Android Show｜I/O Edition, một sự kiện chuyên về Android trước thềm hội nghị I/O vào ngày 19 tháng 5. Tổng giám đốc hệ sinh thái Android, Sameer Samat, đã định hướng cho sự kiện này: Android sẽ chuyển đổi từ một hệ điều hành thành một hệ thống thông minh. Nền tảng cho hướng đi này là Gemini Intelligence – một khả năng AI chủ động được tích hợp ở cấp độ hệ thống của Android.

Windows

2026年Android Show｜I/O Edition发布会海报
Nguồn: Android Headlines

So sánh với tổ hợp Gemini Nano + AICore năm ngoái, lần này Google đã tích hợp sâu hơn khả năng của Agent vào cấp độ hệ điều hành: tự động hóa tác vụ xuyên ứng dụng (đặt món, mua sắm, đặt hàng), điền biểu mẫu tự động, tóm tắt trang web, tiện ích tùy chỉnh — lần lượt được thêm vào danh sách năng lực cấp hệ thống. Google đồng thời liệt kê ba nguyên tắc sản phẩm là: kiểm soát rõ ràng của người dùng (explicit user control), bảo vệ dữ liệu toàn diện (comprehensive data protection) và minh bạch vận hành (operational transparency).

Vào ngày 19 tháng 5, một tuần sau, trong bài phát biểu chủ đề I/O, CEO của Google Sundar Pichai đã mở đầu theo hướng này:

Chào mừng đến với thời đại Gemini được agent hóa

Không phải là người khởi đầu sớm trong làn sóng chuyển đổi OS cạnh端 thành agent, Google vẫn chưa nắm bắt được lợi thế đầu tiên.

Microsoft đã ra mắt Copilot+PC tại Build 2024 vào tháng 5 năm 2024 (dòng sản phẩm Windows 11 mới với NPU có khả năng đạt hơn 40 TOPS), tích hợp khả năng Agent vào hệ điều hành thông qua ba tính năng: mô hình nhỏ đầu cuối Phi Silica, khả năng màn hình Click to Do và bộ nhớ hoạt động cấp hệ thống Recall.

Tại WWDC24 vào tháng 6 năm 2024, Apple đã chính thức công bố “Apple Intelligence”, lúc đó Apple định vị nó là “hệ thống trí tuệ cá nhân”, sau đó lần lượt ra mắt một số tính năng hỗ trợ AI, tuy nhiên do mô hình lớn tự phát triển gặp khó khăn và Siri “ngu ngốc”等问题, khả năng Agent cốt lõi của Apple Intelligence vẫn chưa được ra mắt.

Huawei sẽ ra mắt HarmonyOS 6 và Khung trí tuệ鸿蒙 (HMAF) tại HDC 2025 vào tháng 6 năm 2025, sau đó Quảng trường Trí tuệ Xiao Yi sẽ ra mắt hơn 80 trí tuệ.

Xu hướng lớn hóa OS phía thiết bị đầu cuối đã đồng thời xuất hiện trên các hệ điều hành chính như Android, iOS, HarmonyOS và Windows.

Cuộc họp báo chỉ trình diễn các tính năng, nhưng điều mà các nhà sản xuất hệ điều hành thực sự cần cạnh tranh là ba năng lực nền tảng hỗ trợ OS Agent hoạt động ổn định và thực sự giải quyết vấn đề: Runtime AI cấp hệ thống, chip có thể kiểm soát, và ma trận mô hình đầu cuối - đám mây.

II. Dưới buổi ra mắt: Ba nền tảng hỗ trợ OS Agent

Hệ thống AI Runtime cấp hệ thống: Trung tâm điều phối trí tuệ đầu cuối

Runtime là động cơ suy luận và dịch vụ hệ thống chạy mô hình ở phía thiết bị. Về phía dưới, nó kết nối trực tiếp với NPU và hệ thống điều phối tài nguyên; về phía trên, nó cung cấp khả năng suy luận thông qua API ổn định cho tất cả các ứng dụng. Nó biến mô hình phía thiết bị thành “trí tuệ chia sẻ ở cấp OS”: chia sẻ trọng số mô hình giữa các ứng dụng, điều phối thống nhất năng lực tính toán và bộ nhớ, hỗ trợ gọi công cụ cần thiết cho Agent, hướng dẫn tạo nội dung, và kết nối ngữ cảnh cùng quyền hạn. Nó quyết định liệu Agent của hệ điều hành chỉ là một nút trò chuyện trong ứng dụng, hay là một dịch vụ thường trực trên hệ điều hành có thể thực hiện các thao tác cấp hệ thống.

Mẫu hoàn chỉnh nhất trong hệ sinh thái Android là Google AICore. Tháng 12 năm 2023, AICore được ra mắt như một dịch vụ hệ thống (system service) của Android 14; tháng 8 năm 2025, Gemini Nano được mở cho các nhà phát triển thông qua các API ML Kit GenAI. Từ nền tảng dịch vụ hệ thống đến các API ổn định dành cho ứng dụng, AICore đã mất gần hai năm để không ngừng tinh chỉnh.

Các nhà sản xuất OS khác cũng đi theo con đường tương tự, chỉ khác ở nhịp độ. Apple mở khung Foundation Models cho các nhà phát triển tại WWDC25, khung này tích hợp sẵn bộ trang trí @Generable, gọi công cụ, tạo có hướng dẫn (guided generation) và phiên có trạng thái (stateful session), được hỗ trợ bởi mô hình nền tảng đầu cuối khoảng 3B tham số cùng tính toán đám mây riêng tư. Microsoft tích hợp khung AI đầu cuối Foundry on Windows và Phi Silica vào Windows 11, sử dụng Windows ML làm backend suy luận dưới nền. Huawei công bố Agent Framework Kit (khung đại diện thông minh HarmonyOS, HMAF) tại HDC 2025, đồng thời mở rộng hệ thống ý định và giao thức hợp tác đại diện.

Windows

Android AICore là dịch vụ hệ thống điều phối Gemini Nano thực hiện suy luận trên bộ xử lý phần cứng
Nguồn: Android Developers

Chip được kiểm soát: Điểm tựa của sự phối hợp phần mềm và phần cứng

Google đã thiết lập ngưỡng phần cứng rõ ràng cho Gemini Intelligence tại Android Show｜I/O Edition: bộ tính năng đầy đủ sẽ chỉ ra mắt trên một số dòng flagship mới nhất như Pixel 10 và Galaxy S26, tất cả các mẫu máy năm ngoái đều không được bao gồm. Điều này chỉ ra một sự thật đơn giản: các mô hình AI vẫn đang phát triển nhanh chóng, và phần mềm liên tục đặt ra những yêu cầu mới đối với phần cứng. Chip được kiểm soát là nền tảng tiếp nhận những yêu cầu này, mức độ kiểm soát quyết định không gian mà các nhà sản xuất hệ điều hành sử dụng để tối ưu phần mềm và phần cứng cho OS Agent trên thiết bị đầu cuối.

Apple là biểu tượng của chiến lược tích hợp phần cứng và phần mềm. iOS và macOS đã cùng phát triển song song với các chip A-series và M-series từ những ngày đầu, trong khi Core ML đóng gói toàn bộ việc điều phối CPU, GPU và ANE vào lớp khung. Chiến lược này tiếp tục được mở rộng trong thời đại LLM. Apple Machine Learning Research đã đưa ra một bộ dữ liệu thực nghiệm: bằng cách tối ưu theo đường đi của Core ML để triển khai Llama 3.1 8B Instruct trên M1 Max, tốc độ giải mã cục bộ có thể đạt khoảng 33 token/giây. Báo cáo kỹ thuật “Apple Intelligence Foundation Language Models” cũng tiết lộ rằng Apple đã thực hiện các tối ưu cấp kiến trúc như chia sẻ KV cache và huấn luyện nhận thức lượng tử 2-bit dành riêng cho chip của mình, mới có thể thành công trong việc mở rộng các mô hình nền tảng khoảng 3B cho các nhà phát triển thông qua khung Foundation Models. Mức độ sâu sắc này chỉ có thể đạt được khi tự kiểm soát chip của mình — đây chính là giá trị của chip kiểm soát được đối với các nhà phát triển hệ điều hành: nó quyết định mức độ sâu của sự phối hợp phần mềm-hardware, đồng thời nâng cao giới hạn trải nghiệm của OS Agent phía đầu cuối.

Nhập vào thời đại AI, Google cũng đang làm điều tương tự — kể từ Pixel 6, họ theo đuổi con đường tự phát triển SoC Tensor, với Tensor G5 mới nhất tăng hiệu năng TPU lên tới 60%, CPU trung bình tăng 34%, và là SoC đầu tiên chạy đầy đủ Gemini Nano thế hệ mới nhất trên Pixel 10. Tuy nhiên, Tensor G5 cũng có điểm yếu: kết quả thực tế từ Android Central cho thấy cấu hình bộ nhớ (dung lượng RAM) vẫn là điểm nghẽn hiệu năng AI, điểm Geekbench AI thua Snapdragon 8 Elite; trong bài kiểm tra Geekbench 6 của Macworld, điểm đơn nhân và đa nhân của G5 đều thấp hơn A18 Pro. Google vẫn đang cố gắng bắt kịp, nhưng hướng đi kết hợp Tensor tự phát triển với Gemini tại thiết bị đầu cuối đã hình thành.

Hiawei Kirin kết hợp với NPU Da Vinci và mô hình đầu cuối Panggu là một con đường chip có thể kiểm soát song song với Apple và Google. Xiaomi đã triển khai Xuanjie O1, là người tham gia mới hướng tới chip có thể kiểm soát.

Ma trận mô hình đầu cuối và đám mây: Nguồn trí tuệ của Agent

Ma trận mô hình đầu cuối và đám mây là nguồn gốc “trí tuệ” của thiết bị đầu cuối: mô hình đám mây nâng cao khả năng xử lý các tác vụ phức tạp, trong khi mô hình đầu cuối đảm bảo giới hạn tối thiểu cho các hoạt động hàng ngày—độ trễ, thời lượng pin, quyền riêng tư và độ ổn định đều được đặt lên đầu cuối. Cả hai phía đều không thể thiếu, sự khác biệt nằm ở mức độ kết hợp với hệ điều hành. Mô hình đầu cuối phải được nhúng vào hệ điều hành của từng thiết bị đầu cuối và kết hợp sâu với NPU cục bộ, đảm nhận vai trò kép trong hệ điều hành: về phía dưới, nó là backend suy luận cục bộ của Runtime; về phía trên, nó cung cấp các API cấp hệ thống cho ứng dụng thông qua khung và SDK của Runtime.

Tự nghiên cứu có ý nghĩa cả trên đám mây lẫn trên thiết bị đầu cuối, nhưng lợi ích trên thiết bị đầu cuối rõ ràng hơn. Các mô hình đám mây mua ngoài cũng có thể đạt đến giới hạn năng lực, nhưng lợi thế của tự nghiên cứu chủ yếu nằm ở quyền kiểm soát định tuyến, điều khoản thương mại và nhịp độ cập nhật mô hình. Với thiết bị đầu cuối thì khác. Mô hình thiết bị đầu cuối được nhúng vào hệ điều hành và NPU của từng thiết bị, lợi ích của việc tự nghiên cứu trực tiếp thể hiện qua hiệu suất sản phẩm: chia sẻ KV cache, huấn luyện nhận biết lượng tử 2-bit được thiết kế riêng cho thế chip nào đó, Per-Layer Embedding (có nguồn gốc từ Gemma 3n, tải tăng dần tham số nhúng từ bộ nhớ nhanh theo từng lớp) v.v., tất cả những điều này đều cần được thiết kế đồng bộ giữa mô hình và phần cứng mới dễ dàng thực hiện; đồng thời, nhịp độ phối hợp cũng không thể tiếp tục bị ràng buộc bởi các nhà sản xuất phần cứng bên thứ ba.

Tính toán TPU của Tensor G5 tăng tới 60% so với thế hệ trước G4, nhưng sự cải thiện của Gemini Nano trên G5 còn vượt xa hơn thế—theo dữ liệu từ Google và Jon Peddie Research, tốc độ xử lý cục bộ đạt 2,6 lần thế hệ trước, mức tiêu thụ năng lượng giảm một nửa, và cửa sổ token được mở rộng từ 12.000 lên 32.000 (tương đương với khả năng xử lý khoảng một trăm ảnh chụp màn hình cùng lúc). Những hiệu suất vượt trội này đến từ kiến trúc Matryoshka Transformer linh hoạt trong Gemini Nano v3, kết hợp với tối ưu hóa đồng bộ với TPU Tensor G5.

Windows

Hiệu suất nhảy vọt của Gemini Nano trên Tensor G5 so với thế hệ trước
Nguồn: Google/Jon Peddie Research, hình ảnh do Cloud Burst AI tạo

Ở cấp độ mô hình phía đầu cuối, các nhà sản xuất hệ điều hành chính đều sở hữu các mô hình riêng: Gemini Nano của Google, mô hình nền tảng phía đầu cuối khoảng 3 tỷ tham số của Apple, Phi Silica của Microsoft và mô hình phía đầu cuối Pangu của Huawei. Tự phát triển là lựa chọn mặc định ở cấp độ này.

Ba. Giữa ba lớp: sự phối hợp càng sâu, không gian khác biệt càng lớn

Ba cấp năng lực nền tảng được kết nối từ dưới lên: chip kiểm soát được → mô hình đầu cuối/mây → Runtime → Agent. Chip kiểm soát được quyết định hiệu suất suy luận và mức tiêu thụ năng lượng mà mô hình đầu cuối có thể đạt được, mô hình đầu cuối quyết định trí tuệ cục bộ có thể được Runtime điều phối, và Runtime quyết định độ tin cậy của Agent khi thực hiện xuyên ứng dụng như một dịch vụ hệ thống. Càng phối hợp sâu sắc, nhà sản xuất hệ điều hành càng tạo ra sự khác biệt lớn hơn trong trải nghiệm sản phẩm Agent đầu cuối và xây dựng được hàng rào bảo vệ vững chắc hơn.

Các lớp càng ăn khớp sâu hơn trong cùng một bộ phần mềm và phần cứng, khả năng sản phẩm của OS Agent càng thể hiện những sự khác biệt mà một lớp đơn lẻ không thể đạt được.

Phản hồi trễ và mức tiêu thụ năng lượng. Gemini Nano đạt tốc độ xử lý nhanh gấp 2,6 lần và giảm một nửa mức tiêu thụ năng lượng trên Tensor G5 nhờ vào sự tương thích lẫn nhau giữa kiến trúc mô hình, thiết kế chip và lịch trình Runtime trong cùng một thế hệ thiết kế phần mềm-hardware, mới có thể tạo ra sự cải thiện ở quy mô này.
Quyền riêng tư và độ tin cậy. Các tác vụ thường xuyên liên quan đến dữ liệu riêng tư được thực hiện ngay tại thiết bị bởi mô hình đầu cuối, trong khi các yêu cầu phức tạp hơn mới được chuyển lên đám mây — đây là tư thế mặc định hợp lý mà OS Agent đang áp dụng đối với dữ liệu người dùng. Ba yếu tố kết hợp quyết định liệu mô hình “ưu tiên đầu cuối, đám mây làm nền” có thể thực sự được triển khai hay không: NPU được tối ưu sâu với mô hình đầu cuối, là con đường then chốt giúp các mô hình đầu cuối đang trong giai đoạn phát triển đảm nhận các nhiệm vụ suy luận tần suất cao hàng ngày; mô hình được lượng tử hóa và nén, đồng thời chia sẻ KV cache với NPU; Runtime định tuyến giữa đầu cuối và đám mây dựa trên độ phức tạp của nhiệm vụ. Nếu bất kỳ yếu tố nào trong ba yếu tố này không được thực hiện đầy đủ, “ưu tiên đầu cuối” sẽ chỉ là lời quảng cáo.
Bối cảnh cấp hệ thống. Nhà sản xuất hệ điều hành tái tổ hợp dữ liệu người dùng xuyên ứng dụng và xuyên hệ điều hành (chỉ mục ngữ nghĩa, nhận thức màn hình, trí nhớ dài hạn) thành ngữ cảnh cá nhân cấp hệ thống để cung cấp cho Agent, đây là điều kiện tiên quyết để Agent thực sự “hiểu người dùng” và cũng là đặc điểm cốt lõi phân biệt Agent hệ điều hành với Agent cấp ứng dụng đơn lẻ. Việc triển khai phụ thuộc vào ba lớp kết nối chặt chẽ: Runtime giữ chỉ mục xuyên ứng dụng và quyền truy cập, mô hình đầu cuối luôn chạy để thực hiện hiểu và suy luận, NPU cung cấp sức mạnh tính toán hiệu quả tại chỗ. Core Spotlight của Apple tạo chỉ mục ngữ nghĩa trên thiết bị đầu cuối, các ứng dụng kết nối hành động và dữ liệu vào hệ thống thông qua App Intents, Agent sẽ lấy ngữ cảnh thông qua Personal Context (Apple đã công bố tính năng này sẽ được triển khai trong bản cập nhật phần mềm tương lai); Android cũng đi theo con đường tương tự với AppFunctions.
Về độ tin cậy của dịch vụ hệ thống. OS Agent phải được gọi như một dịch vụ cấp hệ thống, nên duy trì khả năng hoạt động trong các tình huống thực tế như không kết nối mạng, pin yếu, giảm tần số do nhiệt độ cao. Mô hình đầu cuối luôn chạy trên thiết bị, giúp Agent hoạt động mà không cần mạng; NPU được tối ưu hóa cao về phần mềm và phần cứng đảm nhận suy luận tiêu thụ ít năng lượng; Runtime điều phối lại theo mức độ sẵn có khi tài nguyên thiết bị khan hiếm (chuyển sang mô hình nhẹ hơn hoặc định tuyến yêu cầu lên đám mây). Nếu thiếu bất kỳ lớp nào trong ba lớp này, OS Agent sẽ không thể đảm nhận vai trò dịch vụ hệ thống, mà chỉ có thể trở lại dạng nút trò chuyện cấp ứng dụng.

Apple Intelligence mang đến một mô hình hợp tác toàn diện: Apple Silicon, khoảng 3B mô hình nền tảng tại thiết bị, khung Foundation Models được tích hợp từ dưới lên, xử lý các tình huống phổ biến tại thiết bị và chuyển các yêu cầu phức tạp sang tính toán đám mây riêng tư. Google là một hình thái khác. Tensor G5, là SoC đầu tiên chạy hoàn toàn Gemini Nano thế hệ mới nhất, được triển khai trên Pixel 10, với AICore điều phối thống nhất, cho phép các tính năng hệ thống như Magic Cue và Pixel Screenshots được kích hoạt mặc định mà không cần phụ thuộc vào đám mây. Huawei là điển hình trong việc xây dựng sự hợp tác ba lớp trong nước: Kirin, NPU Da Vinci, PanGu tại thiết bị và HMAF đều là sản phẩm tự phát triển, được kết nối chặt chẽ từ dưới lên để tạo thành nền tảng ba lớp hoàn chỉnh.

Windows

Cơ chế ăn khớp ba lớp của OS Agent phía đầu cuối
Nguồn: CloudSurge AI

IV. Trên nền tảng: Các biến số then chốt khác của hào bảo vệ dài hạn

Lớp thứ ba hợp tác tạo thành lõi của hàng rào bảo vệ. Trên nền tảng này còn có nhiều biến số ảnh hưởng đến năng lực cạnh tranh sản phẩm trong thời đại OS Agent, bao gồm khả năng tương tác giữa Agent và App, bảo vệ quyền riêng tư, v.v.

OS Agent và App tương tác tại tiền tuyến của cuộc cạnh tranh giữa nhà sản xuất hệ điều hành và nhà phát triển ứng dụng. Hiện tại có hai con đường song song. Một là nhận diện màn hình và tự động hóa, bao gồm Gemini Live chia sẻ màn hình, Apple Visual Intelligence, Circle to Search, v.v. OS Agent can thiệp vào App bằng cách đọc màn hình và nhấn nút, có thể thực hiện nhiệm vụ đơn lẻ, nhưng mỗi lần gọi đều thiếu thông tin có cấu trúc, khiến việc xây dựng luồng làm việc đa bước trở nên khó ổn định. Con đường thứ hai là tích hợp sâu qua API, bao gồm Google AppFunctions, Apple App Intents, Huawei Intents Kit, v.v. App phơi bày các hành động cốt lõi dưới dạng giao diện có cấu trúc cho hệ thống, giúp Agent gọi một cách ổn định và xây dựng được luồng làm việc đa bước. Khả năng mở rộng con đường API phụ thuộc không phải vào nhà sản xuất hệ điều hành, mà vào nhà phát triển App. Việc giao các chức năng cốt lõi cho Agent gọi nghĩa là người dùng có thể không còn mở trực tiếp App nữa, dẫn đến nguy cơ bị hệ điều hành chiếm mất các quyền lợi như hiển thị thương hiệu, vị trí quảng cáo, dữ liệu hành vi và cổng thanh toán. Đây sẽ là điểm tranh giành cốt lõi về quyền phân phối lưu lượng đầu cuối phía người dùng.

Bảo vệ quyền riêng tư là giá trị cốt lõi và ranh giới không thể vượt qua của hệ thống đầu cuối. Các nhà sản xuất hệ điều hành sở hữu quyền truy cập cấp hệ thống sâu nhất và dữ liệu người dùng nhạy cảm nhất tại đầu cuối; quyền riêng tư không chỉ là lập trường cốt lõi mà còn là điều kiện tiên quyết để thúc đẩy hai mục tiêu trên trong dài hạn. Apple đã xây dựng hệ thống bảo vệ quyền riêng tư dựa trên thiết bị bằng cách sử dụng cùng một thiết kế bảo mật cấp phần cứng chia sẻ giữa chip bảo mật Secure Enclave đầu cuối và các nút điện toán đám mây riêng PCC. Chiến lược sản phẩm này đã biến “Privacy. That’s Apple.” thành nhãn hiệu cốt lõi của Apple trên thị trường cao cấp toàn cầu, từ đó giành được sự tin tưởng của người dùng.

Windows

Nhãn “Quyền riêng tư. Đó là Apple.” của Apple
Nguồn: Trang web chính thức của Apple

Ba lớp phối hợp tạo thành cốt lõi của hàng rào bảo vệ, những biến số dài hạn trên nền tảng này ảnh hưởng đến mức độ củng cố sâu đến đâu.

五. Không chỉ là làm lại OS

Trong xu hướng chuyển đổi OS đầu cuối thành agent, càng夯实 hệ thống AI Runtime cấp hệ thống, chip kiểm soát được và ma trận mô hình đầu cuối - đám mây, thì nhà sản xuất OS càng có mức đáy sản phẩm cao hơn và không gian khác biệt hóa lớn hơn. Những nhà sản xuất OS nắm bắt được xu hướng này mới có cơ hội thúc đẩy việc tái phân bổ quyền kiểm soát luồng truy cập đầu cuối, giành vị thế cạnh tranh mạnh mẽ hơn.

Xu hướng này không chỉ dừng lại ở điện thoại và PC. Khả năng nền tảng của OS Agent đang lan rộng sang nhiều thiết bị đầu cuối hơn thông qua hệ sinh thái đa thiết bị mà mỗi công ty đã xây dựng, đặc biệt nổi bật trong lĩnh vực IoT. Các chip điều khiển đang được áp dụng vào các bối cảnh như SoC ô tô; Huawei đã triển khai chip Kirin đạt tiêu chuẩn ô tô, trong khi Xiaomi澎湃OS đã tích hợp vào các mẫu xe của mình; các mô hình đầu cuối đang được tối ưu hóa để di chuyển sang các thiết bị mới như kính thông minh; kính thực tế tăng cường Android XR do Google, Samsung, Gentle Monster và Warby Parker hợp tác phát triển sẽ ra mắt vào mùa thu năm 2026; sự phối hợp giữa Runtime và Agent đang được mở rộng sang nhóm thiết bị thông qua các khung “siêu thiết bị/phân tán” mà mỗi công ty đã triển khai, ví dụ như 1+8+N và bus phần mềm phân tán HarmonyOS của Huawei, “hệ sinh thái toàn diện người-xe-nhà” và HyperConnect của Xiaomi, Continuity của Apple, cùng với Cross device SDK và dịch vụ liên thiết bị của Google. Cuộc chiến của OS Agent còn vượt xa khỏi việc giành thắng lợi trên điện thoại và PC.

AICore đã được tinh chỉnh trong gần hai năm; hệ điều hành của Apple và loạt chip Apple Silicon đã được tối ưu trong hơn một thập kỷ; Tensor đã liên tục được cải tiến đến G5, mới đủ khả năng gánh vác Gemini Nano v3 trên Pixel 10. Sự thắng thua của cuộc chiến này không nằm ở một hoặc hai giờ trên sân khấu ra mắt, mà được rèn giũa qua từng thế hệ chip, mô hình và Runtime.

Tài liệu tham khảo:

Gemini Intelligence mang trí tuệ nhân tạo chủ động lên Android｜Blog của Google
I/O 2026: Chào mừng đến với kỷ nguyên Gemini tác nhân｜Blog của Google
Phi Silica, SLM trên thiết bị nhỏ nhưng mạnh mẽ｜Windows Experience Blog
Apple hoãn nâng cấp Siri vô thời hạn｜Bloomberg
Thông cáo báo chí về việc khởi động Developer Beta của HarmonyOS 6 (HDC 2025) | Huawei
Gemini Nano mới nhất với các API GenAI của ML Kit trên thiết bị｜Blog của Android Developers
Tài liệu khung Foundation Models｜Apple Developer
Sách trắng về khung kiến trúc thông minh HarmonyOS | Nhà phát triển Huawei
Llama 3.1 trên thiết bị với Core ML｜Nghiên cứu Máy học của Apple
Báo cáo công nghệ mô hình ngôn ngữ nền tảng Apple Intelligence 2025｜Nghiên cứu máy học của Apple
Google Tensor G5: Kết quả kiểm tra và mọi điều bạn cần biết｜Android Central
M5 SoC mới của Google (Tensor G5 chi tiết · Matryoshka Transformer)｜Jon Peddie Research
Tính toán đám mây riêng: Một ranh giới mới cho quyền riêng tư AI trong đám mây｜Apple Security Engineering
Tổng quan về AppFunctions｜Android Developers
Ý định Ứng dụng｜Apple Developer
Giới thiệu về Intents Kit (HarmonyOS) | Huawei Developer
Chip Tensor G5 của Google Pixel 10 Pro ấn tượng—nếu bạn so sánh với iPhone 14｜Macworld
Tổng quan mô hình Gemma 3n｜Google AI cho Nhà phát triển