A Apple lançou o novo framework Core AI na WWDC, substituindo o Core ML, que estava em uso há 9 anos, reescrito desde a primeira linha de código para a era dos grandes modelos.

Autor e fonte do artigo: Nova Inteligência

A última WWDC da KuCoin revolucionou a base de IA da Apple.

A Apple eliminou o Core ML, que estava em uso por nove anos, e substituiu-o pelo Core AI, reescrito desde a primeira linha de código para modelos grandes.

Apple drew the same line for all AI

O novo Core AI é um framework de inferência AI na borda projetado pela Apple para a era dos grandes modelos.

Ele coordena unificadamente os três chips: CPU, GPU e Neural Engine, oferecendo suporte nativo às capacidades fundamentais dos LLM, como geração autoregressiva, resposta em fluxo e diálogos multirround, abrangendo toda a plataforma, desde o iOS 27 até o watchOS 27.

Em resumo, o Core ML é para machine learning tradicional, e o Core AI é para modelos grandes.

Meanwhile, the accompanying toolchain has been completely redone.

Novo formato de modelo .aimodel, conjunto de ferramentas coreai-torch aberto pela Apple, além de recursos de otimização de desempenho e compilação antecipada no Xcode, cobrindo toda a cadeia, da conversão do modelo até a implantação e publicação.

Por exemplo, um aplicativo de aprendizado de idiomas.

O aluno pega o celular e aponta para um beija-flor; o SAM3 realiza simultaneamente, no dispositivo, duas tarefas: identifica o objeto na imagem como "Hummingbird" e separa com precisão o beija-flor do fundo, gerando uma imagem limpa para o cartão.

Em seguida, um modelo Qwen com 0,6B de parâmetros assume a parte do texto, usando os resultados reconhecidos para gerar um cartão de palavras estruturado, com três campos: palavra em chinês, definição em inglês e exemplo, cada um em seu lugar correto; o retorno é um tipo nativo do Swift, não um bloco de texto que precise ser analisado novamente.

Todo o processo ocorre offline, sem chamadas à API, totalmente no dispositivo móvel.

Por trás disso, está o repositório oficial da Apple, coreai-models, que contém modelos de código aberto pré-otimizados, como Qwen, Mistral e SAM3, todos adaptados para o Apple Silicon. Os desenvolvedores podem cloná-los e executá-los em seus aplicativos com apenas algumas linhas de código Swift.

Se não quiser usar o pronto, também pode usar seu próprio modelo.

A Apple sincronizou no GitHub o pacote open-source coreai-torch, permitindo converter um modelo PyTorch para o formato .aimodel com apenas 5 linhas de Python, para compilação e implantação no Xcode.

Endereço do projeto:

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

No entanto, a Apple não quer apenas executar modelos, mas unificar todos os modelos.

Do ponto de vista técnico, trata-se do novo protocolo Language Model no framework Foundation Models. Ele define uma API Swift unificada, permitindo que qualquer modelo que o siga seja chamado pelo mesmo conjunto de código.

O modelo local da Apple segue este protocolo, os modelos de código aberto executados pelo Core AI seguem este protocolo, e grandes modelos em nuvem como Claude e Gemini também seguem este protocolo.

Um único código, três modelos, transição perfeita do local para a nuvem. A Apple transformou-se na camada de roteamento de IA.

Um modelo de 20 bilhões está escondido no armazenamento flash do celular

Executados no framework Foundation Models estão os cinco modelos da terceira geração da família de modelos proprietários desenvolvidos em conjunto pela Apple e pelo Google, AFM 3.

Dois na borda:

1. O AFM 3 Core é um modelo denso com 3B parâmetros, responsável por tarefas leves do dia a dia;

2. AFM 3 Core Advanced é um modelo esparsa com 20 bilhões de parâmetros, o limite superior para dispositivos da Apple.

Três na nuvem:

1. O AFM 3 Cloud é o servidor principal;

2. ADM 3 Cloud é especializado em geração e edição de imagens (por trás do Image Playground está ele);

3. O AFM 3 Cloud Pro é o mais poderoso de toda a família.

Entre eles, o grande destaque na borda é o AFM 3 Core Advanced, um modelo grande de 20 bilhões de parâmetros, executado diretamente no celular.

Por lógica, a memória de um telefone simplesmente não consegue acomodar esse volume. Modelos tradicionais grandes exigem que todos os pesos sejam armazenados na DRAM; 20 bilhões de parâmetros já são desafiadores até para dispositivos de mesa.

A solução da Apple para isso é chamada Instruction-Following Pruning.

O modelo completo está armazenado na memória flash (NAND). Após receber uma solicitação, um módulo de roteamento leve seleciona quais especialistas precisam ser ativados e carrega apenas essas partes dos pesos na DRAM. A quantidade de parâmetros efetivamente carregados varia entre 1 bilhão e 4 bilhões, dependendo da complexidade da tarefa.

Um modelo com 20 bilhões de parâmetros utiliza apenas 5% a 20% durante a execução, enquanto o restante permanece silenciosamente armazenado no flash aguardando ser chamado.

Nesta nuvem, é o modelo de servidor mais poderoso da Apple — AFM 3 Cloud Pro.

Para enfrentar a raciocínio complexo e a chamada de ferramentas de Agent, a Apple, em parceria com o Google e a NVIDIA, expandiu o Private Cloud Compute para as GPUs NVIDIA no Google Cloud. As regras de privacidade permanecem as mesmas: os dados não saem do domínio.

Os resultados práticos também corroboram a eficácia desta arquitetura.

O AFM 3 Core foi considerado superior em 45,6% dos prompts de teste em comparação com a geração anterior, que tinha apenas 23,3% de vantagem. Na nuvem, a diferença do AFM 3 Cloud é ainda mais extrema: 64,7% contra 8,7%, quase uma dominação unilateral.

A arquitetura e os benchmarks já foram cobertos; agora vem a pergunta mais importante para os desenvolvedores: quanto custa tudo isso?

Se o seu app tiver menos de 2 milhões de downloads iniciais na App Store, o cálculo em nuvem do Private Cloud Compute é totalmente gratuito, sem custos de API nem taxas de token. Basta desenvolver seu app.

Pode-se dizer que essa barreira foi precisamente posicionada entre desenvolvedores independentes e pequenas equipes.

Três linhas de código, Claude na mesa

Entre as adaptações de terceiros publicamente lançadas, a Anthropic foi a primeira a entregar.

No mesmo dia 8 de junho, após o encerramento da keynote da WWDC, a Anthropic lançou imediatamente um pacote Swift, integrando-se oficialmente ao framework Foundation Models, disponível a partir de 9 de junho.

A ideia é simples.

Os modelos locais da Apple são excelentes em tarefas leves, como resumo, extração de informações e classificação, sendo rápidos, sem necessidade de conexão à internet e de custo zero. No entanto, ao enfrentar demandas complexas, como raciocínio em múltiplos passos, geração de código ou busca online, os modelos locais não conseguem suportar.

E o pacote Swift do Claude foi exatamente ajustado nessa junta.

Os desenvolvedores chamam normalmente os modelos locais da Apple dentro do framework Foundation Models; quando a tarefa excede a capacidade local, o framework roteia automaticamente a solicitação para o Claude, e os resultados são retornados em fluxo para a mesma visualização SwiftUI.

O usuário não percebe a mudança em nenhum momento; para eles, é apenas um aplicativo.

Em outras palavras, se um aplicativo de anotações ou estudo que você usa frequentemente de repente ficar mais inteligente e conseguir fazer análise semântica entre documentos, é muito provável que os desenvolvedores tenham integrado esse pacote.

Por exemplo, um aplicativo de diário pode usar um modelo de borda para gerar dicas de escrita diárias, mas quando o usuário perguntar “Quais são os temas comuns nos diários destes meses?”, essa inferência semântica transversal no tempo é automaticamente encaminhada para o Claude.

No entanto, o arranjo da Anthropic no ecossistema da Apple não se limita a este passo.

O Claude Agent já foi integrado ao Xcode 26.3 desde fevereiro deste ano, ajudando desenvolvedores a escrever código, executar testes e automatizar tarefas.

Mas o Claude no Xcode é voltado para os próprios desenvolvedores, enquanto o Claude nos Modelos Fundamentais é voltado para os usuários finais do aplicativo.

Para a Anthropic, esta é uma entrada de distribuição no mercado consumidor, atrasada, mas crucial.

Claude tem atuado fortemente nos mercados de desenvolvedores e empresas, mas tem quase nenhuma presença diante dos consumidores comuns.

Desta vez, o framework de Modelos Fundamentais da Apple lhe forneceu um caminho para alcançar um bilhão de usuários.

2,5 bilhões de dispositivos, uma arena

Revisando todas as ações da última WWDC da KuCoin, uma linha condutora permeia tudo.

A Apple não quer ser uma empresa de modelos de IA. Ela entregou o cérebro do Siri à Google, entregou o runtime de modelos abertos ao Core AI e deu aos usuários a escolha de modelos de terceiros.

O que ele vai fazer é o ringue.

2,5 bilhões de dispositivos, protocolo unificado de Language Model, framework completo de agendamento do lado da extremidade até a nuvem.

Quem tiver o melhor modelo poderá alcançar o maior grupo de usuários de alto valor do planeta por meio desta plataforma.

A competição entre as gigantes de IA ganhou um novo dimensionamento a partir de hoje.

Anteriormente, a Anthropic e a OpenAI competiam por volume de chamadas de API, ferramentas para desenvolvedores e contratos empresariais.

Agora a Apple trouxe o campo de batalha para o bolso de todos; quem conquistar o posto de “motor de IA padrão” vencerá a próxima rodada.

Em 1º de setembro, John Ternus assumiu a CEO da Apple. Ele herda não apenas uma empresa de hardware, mas também o ringue de IA deixado por Cook.

Apple apresenta o framework de IA principal na WWDC, substituindo o Core ML após 9 anos

Apple drew the same line for all AI

Um modelo de 20 bilhões está escondido no armazenamento flash do celular

Três linhas de código, Claude na mesa

2,5 bilhões de dispositivos, uma arena