Apple lanza un nuevo marco Core AI en la WWDC, reemplazando a Core ML, que lleva 9 años en servicio, reescrito desde la primera línea de código específicamente para la era de los modelos grandes.

Autor y fuente del artículo: Nuevos智元

La última WWDC de Cook revolucionó la base de IA de Apple.

Apple ha eliminado por completo Core ML, que llevaba 9 años en servicio, y su reemplazo, Core AI, se reescribió desde la primera línea de código para modelos grandes.

Apple drew the same line for all AI

Core AI es un marco de inferencia de IA en el dispositivo diseñado exclusivamente por Apple para la era de los modelos grandes.

Coordina de forma unificada los tres chips: CPU, GPU y Neural Engine, admite nativamente capacidades fundamentales de los LLM como generación autoregresiva, respuesta en flujo y conversaciones multirround, y cubre toda la plataforma desde iOS 27 hasta watchOS 27.

En pocas palabras, Core ML es para el aprendizaje automático tradicional, y Core AI es para modelos grandes.

Meanwhile, the accompanying toolchain has been completely rebuilt.

Nuevo formato de modelo .aimodel, conjunto de herramientas de conversión coreai-torch de código abierto de Apple, junto con funciones de optimización de rendimiento y compilación anticipada en Xcode, cubren toda la cadena desde la conversión del modelo hasta su implementación y publicación.

Por ejemplo, una aplicación de aprendizaje de idiomas.

El estudiante levanta el teléfono y lo apunta hacia un colibrí; SAM3 realiza simultáneamente en el borde dos tareas: identifica el objeto en la imagen como «Hummingbird» y separa con precisión el colibrí del fondo, generando una imagen limpia para una tarjeta.

Luego, un modelo Qwen de 0.6B parámetros se encarga de la parte de texto, tomando los resultados reconocidos para generar una tarjeta de palabras estructurada con tres campos: palabra en chino, definición en inglés y ejemplo, devolviendo un tipo nativo de Swift, no un bloque de texto que requiera análisis adicional.

Todo el proceso funciona sin conexión a internet, sin llamar a API, completamente en el dispositivo móvil.

Detrás de esto se encuentra el repositorio oficial de Apple, coreai-models, que alberga modelos de código abierto previamente optimizados como Qwen, Mistral y SAM3, todos adaptados para Apple Silicon. Los desarrolladores pueden clonarlo y ejecutarlos en sus propias aplicaciones con solo unas pocas líneas de código Swift.

Si no deseas usar uno preexistente, también puedes usar tu propio modelo.

Apple ha sincronizado en GitHub el paquete open-source coreai-torch, y con solo 5 líneas de Python puedes convertir un modelo PyTorch al formato .aimodel y compilarlo y desplegarlo en Xcode.

Dirección del proyecto:

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

Sin embargo, Apple no solo quiere ejecutar modelos, sino unificar todos los modelos.

En términos técnicos, es el nuevo protocolo Language Model dentro del marco Foundation Models. Define un conjunto unificado de API en Swift, por lo que cualquier modelo que lo siga puede ser invocado con el mismo código.

El modelo local de Apple sigue este protocolo, los modelos de código abierto que ejecuta Core AI siguen este protocolo, y los grandes modelos en la nube como Claude y Gemini también siguen este protocolo.

Un solo código, tres modelos, cambio sin interrupciones de local a la nube. Apple se convirtió en la capa de enrutamiento de la IA.

En la memoria flash del teléfono hay escondido un modelo de 200 mil millones.

Detrás del marco Foundation Models se ejecuta la tercera generación del familia de modelos propios desarrollada conjuntamente por Apple y Google, AFM 3, con cinco modelos lanzados de una sola vez.

Dos en el borde:

1. AFM 3 Core es un modelo denso con 3B parámetros, encargado de tareas ligeras diarias;

2. AFM 3 Core Advanced es un modelo disperso de 20 mil millones de parámetros, el límite superior en dispositivos Apple.

Tres en la nube:

1. AFM 3 Cloud es el servidor principal;

2. ADM 3 Cloud se especializa en generación y edición de imágenes ( detrás de Image Playground está precisamente esto);

3. AFM 3 Cloud Pro es el más potente de toda la familia.

Entre ellos, el potente dispositivo de borde se llama AFM 3 Core Advanced, un modelo grande de 20 mil millones de parámetros que se ejecuta directamente en el teléfono móvil.

Por lógica, la memoria de un teléfono no puede contener una cantidad tan grande. Los modelos tradicionales grandes requieren que todos los pesos caben en la DRAM; 20 mil millones de parámetros ya son difíciles de manejar incluso en dispositivos de escritorio.

La solución de Apple para esto se llama Instruction-Following Pruning.

El modelo completo se almacena en la memoria flash (NAND); tras recibir una solicitud, un módulo de enrutamiento ligero selecciona primero qué expertos activar y luego carga esas partes de los pesos en la DRAM. La cantidad de parámetros realmente utilizados en cada ocasión oscila entre 1 mil millones y 4 mil millones, dependiendo de la complejidad de la tarea.

Un modelo de 20 mil millones de parámetros utiliza solo entre el 5% y el 20% durante el funcionamiento; el resto permanece tranquilamente almacenado en la memoria flash, a la espera de ser llamado.

En la nube, es el modelo de servidor más potente de Apple: AFM 3 Cloud Pro.

Para abordar la inferencia compleja y la llamada a herramientas de Agent, Apple, en colaboración con Google y NVIDIA, ha extendido Private Cloud Compute a las GPU NVIDIA de Google Cloud. Las reglas de privacidad permanecen iguales: los datos no salen del dominio.

Los resultados prácticos también respaldan la efectividad de esta arquitectura.

AFM 3 Core fue considerado superior en el 45,6% de las pruebas de prompt, mientras que la generación anterior tenía una ventaja del 23,3%. En la nube, la diferencia de AFM 3 Cloud es aún más abrumadora: 64,7% frente al 8,7%, casi una dominación unilateral.

Ya se han explicado la arquitectura y las pruebas de rendimiento; ahora surge la pregunta que más interesa a los desarrolladores: ¿cuánto cuesta todo esto?

Si tu app tiene menos de 2 millones de descargas iniciales en la App Store, el cálculo en la nube de Private Cloud Compute es completamente gratuito, sin costos de API ni cargos por tokens. Solo concéntrate en desarrollar tu app.

Se puede decir que este umbral se ajusta precisamente a la posición de los desarrolladores independientes y los pequeños equipos.

Tres líneas de código, Claude en la mesa

Among publicly released third-party adaptations, Anthropic was the first to submit.

El mismo día 8 de junio, al finalizar la keynote de la WWDC, Anthropic lanzó inmediatamente un paquete Swift para integrarse oficialmente con el marco Foundation Models, disponible a partir del 9 de junio.

La idea es muy sencilla.

Los modelos locales de Apple son excelentes para tareas ligeras como resúmenes, extracción de información y clasificación, son rápidos, no requieren conexión a internet y tienen costo cero. Sin embargo, no pueden manejar demandas complejas como razonamiento en múltiples pasos, generación de código o búsquedas en línea.

Y el paquete Swift de Claude se encajó perfectamente en esta costura.

Los desarrolladores invocan normalmente los modelos del lado del dispositivo de Apple dentro del marco Foundation Models; cuando la tarea excede las capacidades del lado del dispositivo, el marco redirige automáticamente la solicitud a Claude, y los resultados de respuesta se devuelven en formato de flujo al mismo vista SwiftUI.

El usuario no percibe ningún cambio durante todo el proceso; para ellos, es simplemente una aplicación.

En otras palabras, si alguna aplicación de notas o estudio que usas habitualmente de repente se vuelve más inteligente y puede realizar análisis semántico entre documentos, probablemente el desarrollador haya integrado este paquete.

Por ejemplo, una aplicación de diario puede usar un modelo del lado del dispositivo para generar sugerencias de escritura diarias, pero cuando el usuario pregunta «¿Qué temas comunes hay en los diarios de estos meses?», esta inducción semántica transversal en el tiempo se entrega automáticamente a Claude.

Sin embargo, el despliegue de Anthropic en el ecosistema de Apple no se limita a este paso.

Claude Agent ya se integró en Xcode 26.3 en febrero de este año, ayudando a los desarrolladores a escribir código, ejecutar pruebas y realizar automatizaciones.

Pero Claude en Xcode está dirigido a los propios desarrolladores, mientras que Claude en Modelos Fundacionales está dirigido a los usuarios finales de la aplicación.

Para Anthropic, esta es una entrada de distribución al consumidor tardía pero crucial.

Claude ha estado siendo muy activo en los mercados de desarrolladores y empresas, pero tiene casi ninguna presencia ante los consumidores comunes.

Esta vez, el marco de modelos fundamentales de Apple le brindó un canal para llegar a mil millones de usuarios.

2.5 mil millones de dispositivos, una arena

Al revisar todos los movimientos de Cook en su última WWDC, una pista atraviesa todo.

Apple no quiere ser una empresa de modelos de IA. Entregó el cerebro de Siri a Google, el entorno de ejecución de modelos de código abierto a Core AI y la elección de IA de terceros a los usuarios.

Lo que tiene que hacer es el ring.

2.5 mil millones de dispositivos, un protocolo de modelo de lenguaje unificado, un marco de programación completo desde el extremo hasta la nube.

Quien tenga el mejor modelo podrá alcanzar a la mayor comunidad de usuarios de alto valor del planeta a través de esta plataforma.

La competencia entre los gigantes de la IA adquiere hoy un nuevo dimension.

Anteriormente, Anthropic y OpenAI competían por volumen de llamadas a la API, herramientas para desarrolladores y contratos empresariales.

Ahora Apple ha trasladado el campo de batalla al bolsillo de cada persona; quien logre ocupar el puesto de «motor de IA predeterminado» ganará la próxima partida.

El 1 de septiembre, John Ternus asumió como CEO de Apple. No solo heredó una empresa de hardware, sino también el ring de IA dejado por Cook.

Apple presenta el marco de IA principal en WWDC, reemplazando Core ML tras 9 años

Apple drew the same line for all AI

En la memoria flash del teléfono hay escondido un modelo de 200 mil millones.

Tres líneas de código, Claude en la mesa

2.5 mil millones de dispositivos, una arena