Apple lance un tout nouveau framework Core AI lors de la WWDC, remplaçant Core ML, qui était en service depuis 9 ans, et réécrit depuis la première ligne de code pour l'ère des grands modèles.
Auteur et source de l'article : Nouvelle Intelligence
La dernière WWDC de Cook a bouleversé les fondations de l'IA d'Apple.
Apple supprime Core ML, qui était en service depuis neuf ans, et remplace celui-ci par Core AI, réécrit depuis la première ligne de code pour les grands modèles.

Apple a tracé la même ligne pour tous les IA
Core AI est un cadre d'inférence AI côté appareil conçu par Apple spécifiquement pour l'ère des grands modèles.
Il gère de manière unifiée les trois puces CPU, GPU et Neural Engine, prend en charge nativement les fonctionnalités de base des LLM telles que la génération autoregressive, les réponses en streaming et les conversations multiround, et couvre l'ensemble des plateformes, d'iOS 27 à watchOS 27 en passant par macOS 27.
En résumé, Core ML est destiné à l'apprentissage automatique traditionnel, tandis que Core AI est conçu pour les grands modèles.
Meanwhile, the accompanying toolchain has been completely redone.
Nouveau format de modèle .aimodel, outil de conversion coreai-torch open source d'Apple, accompagné des fonctionnalités d'optimisation des performances et de compilation anticipée dans Xcode, couvrant l'ensemble du processus de conversion du modèle au déploiement et à la mise en ligne.
Par exemple, une application d’apprentissage des langues.
L'étudiant prend son téléphone et vise un colibri ; SAM3 effectue simultanément deux tâches en périphérie : il identifie l'objet dans l'image comme étant « Hummingbird » et le sépare précisément du fond pour générer une image de carte propre.
Ensuite, un modèle Qwen de 0,6 milliard de paramètres prend en charge la partie texte et génère une fiche vocabulary structurée à partir des résultats d'identification, avec trois champs distincts : mot chinois, définition anglaise et exemple, en retournant un type natif Swift, et non un texte nécessitant un traitement supplémentaire.
L'ensemble du processus s'effectue hors ligne, sans appel d'API, entièrement sur le téléphone local.
Derrière cela se trouve le dépôt officiel d’Apple, coreai-models, qui contient des modèles open source pré-optimisés tels que Qwen, Mistral et SAM3, tous adaptés pour Apple Silicon. Les développeurs peuvent les récupérer et les exécuter dans leurs applications avec quelques lignes de code Swift.
Si vous ne souhaitez pas utiliser un modèle tout fait, vous pouvez également utiliser votre propre modèle.
Apple a synchronisé sur GitHub le package open-source coreai-torch, permettant de convertir un modèle PyTorch au format .aimodel en seulement 5 lignes de Python, puis de le compiler et le déployer dans Xcode.
Adresse du projet :
https://github.com/apple/coreai-models
https://github.com/apple/coreai-torch
Cependant, Apple ne veut pas seulement exécuter des modèles, il veut unifier tous les modèles.
Sur le plan technique, il s'agit du protocole Language Model nouvellement ajouté dans le cadre Foundation Models. Il définit une API Swift unifiée permettant à tout modèle qui le respecte d'être appelé par le même code.
Les modèles locaux d'Apple respectent ce protocole, les modèles open source exécutés par Core AI respectent ce protocole, et les grands modèles cloud tels que Claude et Gemini respectent également ce protocole.
Un seul code, trois modèles, bascule fluide de l'local au cloud. Apple s'est transformée en couche de routage pour l'IA.

Un modèle de 20 milliards caché dans la mémoire flash de votre téléphone
Derrière le cadre Foundation Models s'exécute la troisième génération de la famille de modèles internes développée conjointement par Apple et Google, AFM 3, avec cinq modèles lancés en une seule fois.
Deux côté terminal :
1. AFM 3 Core est un modèle dense de 3B paramètres, chargé des tâches légères quotidiennes ;
2. AFM 3 Core Advanced est un modèle clairsemé de 20 milliards de paramètres, le sommet pour les appareils Apple.
Trois en nuage :
1. AFM 3 Cloud est le serveur principal ;
2. ADM 3 Cloud se spécialise dans la génération et l'édition d'images (c'est ce qui se cache derrière Image Playground) ;
3. AFM 3 Cloud Pro est le plus puissant de toute la famille.
Parmi eux, le puissant outil côté appareil s'appelle AFM 3 Core Advanced, un modèle de 20 milliards de paramètres exécuté directement sur smartphone.
Normalement, la mémoire d'un téléphone ne peut tout simplement pas contenir une telle quantité de données. Les grands modèles traditionnels exigent que tous les poids soient chargés dans la DRAM ; 20 milliards de paramètres représentent déjà un défi pour les appareils de bureau.
La solution d'Apple à ce problème s'appelle Instruction-Following Pruning.
Le modèle complet est stocké dans la mémoire flash (NAND). Après réception d'une requête, un module de routage léger sélectionne d'abord quels experts doivent être activés, puis charge uniquement ces parties de poids en DRAM. La quantité de paramètres effectivement mobilisés varie entre 1 et 4 milliards, selon la complexité de la tâche.
Un modèle de 20 milliards de paramètres n'utilise que 5 % à 20 % de ses paramètres lors de son fonctionnement ; les autres reposent tranquillement en mémoire flash en attendant d'être appelés.
Du côté du cloud, il s'agit du modèle de serveur le plus puissant d'Apple — AFM 3 Cloud Pro.
Pour maîtriser les raisonnements complexes et l'appel aux outils Agent, Apple, en partenariat avec Google et NVIDIA, a étendu Private Cloud Compute aux GPU NVIDIA sur Google Cloud. Les règles de confidentialité restent les mêmes : les données ne quittent pas le domaine.
Les résultats pratiques confirment également l'efficacité de cette architecture.
AFM 3 Core a été jugé supérieur à la génération précédente sur 45,6 % des prompts de test, contre seulement 23,3 % pour la génération précédente. Sur le cloud, l'écart pour AFM 3 Cloud est encore plus marqué : 64,7 % contre 8,7 %, soit une domination presque unilatérale.
L'architecture et les performances ont été expliquées, voici la question qui intéresse le plus les développeurs : combien coûte tout cela ?
Si votre application obtient moins de 2 millions de téléchargements initiaux sur l'App Store, le calcul cloud privé est entièrement gratuit, sans coût d'API ni frais de token. Il vous suffit de développer votre application.
On peut dire que ce seuil correspond précisément aux développeurs indépendants et aux petites équipes.
Trois lignes de code, Claude à la table
Parmi les adaptateurs tiers publiés, Anthropic est le premier à avoir soumis sa réponse.
Le même jour que la fin de la keynote de la WWDC le 8 juin, Anthropic a publié un package Swift pour intégrer officiellement le framework Foundation Models, disponible à partir du 9 juin.
L'idée est simple.
Les modèles locaux d'Apple excellent dans les tâches légères telles que le résumé, l'extraction d'informations et la classification, offrant une rapidité, un fonctionnement hors ligne et un coût nul. Toutefois, face à des exigences complexes comme le raisonnement en plusieurs étapes, la génération de code ou la recherche en ligne, ces modèles locaux ne sont plus à la hauteur.
Et le package Swift de Claude s'aligne précisément sur cette couture.
Les développeurs appellent normalement les modèles côté appareil d'Apple dans le cadre des Foundation Models ; lorsque la tâche dépasse les capacités côté appareil, le cadre redirige automatiquement la requête vers Claude, et les résultats sont renvoyés sous forme de flux vers la même vue SwiftUI.
Les utilisateurs ne perçoivent aucune transition ; pour eux, c'est simplement une application.
Autrement dit, si l'une de vos applications de prise de notes ou d'apprentissage habituelles devient soudainement plus intelligente et peut effectuer une analyse sémantique entre documents, il est probable que les développeurs aient intégré ce package.
Par exemple, une application de journal peut utiliser un modèle côté appareil pour générer des suggestions d'écriture quotidiennes, mais lorsque l'utilisateur demande « Quels sont les thèmes communs de mes journaux ces derniers mois ? », cette induction sémantique transversale est automatiquement transférée à Claude.
Cependant, l'implantation d'Anthropic dans l'écosystème Apple ne s'arrête pas à cette étape.
Claude Agent a été intégré dès février de cette année dans Xcode 26.3, aidant les développeurs à écrire du code, exécuter des tests et automatiser des tâches.
Mais Claude dans Xcode s'adresse aux développeurs eux-mêmes, tandis que Claude dans les modèles fondamentaux s'adresse aux utilisateurs finaux des applications.
Pour Anthropic, c'est une entrée cruciale, bien que tardive, sur le marché de la consommation.
Claude a fortement investi sur les marchés des développeurs et des entreprises, mais a presque aucune présence auprès des consommateurs ordinaires.
Cette fois-ci, le cadre des modèles fondamentaux d'Apple lui offre un canal pour atteindre un milliard d'utilisateurs.
2,5 milliards d'appareils, une arène
En revisitant toutes les actions de la dernière WWDC de Cook, un fil conducteur traverse tout.
Apple ne veut pas être une entreprise de modèles d'IA. Elle a confié le cerveau de Siri à Google, l'exécution des modèles open source à Core AI, et le choix des modèles d'IA tiers aux utilisateurs.
Ce qu'il doit faire, c'est le ring.
2,5 milliards d'appareils, un protocole de modèle linguistique unifié, un cadre de planification complet du périphérique au cloud.
Celui dont le modèle est le meilleur pourra atteindre via cette plateforme le plus grand groupe d'utilisateurs de haute valeur au monde.
La concurrence entre les géants de l'IA prend aujourd'hui une toute nouvelle dimension.
Auparavant, Anthropic et OpenAI se disputaient le volume d'appels d'API, les outils pour développeurs et les contrats entreprises.
Apple a maintenant déplacé le champ de bataille dans la poche de chacun : celui qui remporte la position de « moteur d'IA par défaut » gagnera la prochaine manche.
Le 1er septembre, John Ternus a pris la direction d'Apple. Il hérite non seulement d'une entreprise de matériel, mais aussi de l'arène d'IA laissée par Cook.
