Apple meluncurkan kerangka kerja Core AI baru di WWDC, menggantikan Core ML yang telah beroperasi selama 9 tahun, ditulis ulang dari baris kode pertama khusus untuk era model besar.

Penulis artikel, sumber: Sinar Zhiyuan

WWDC terakhir KuCoin, mengguncang fondasi AI Apple.

Apple menghapus Core ML yang telah beroperasi selama 9 tahun, dan Core AI yang menggantikannya ditulis ulang dari baris kode pertama untuk model besar.

Apple memberikan garis yang sama untuk semua AI

Core AI yang baru adalah kerangka kerja inferensi AI sisi perangkat yang dirancang khusus oleh Apple untuk era model besar.

Ini mengoordinasikan secara terpadu tiga chip: CPU, GPU, dan Neural Engine, mendukung secara native kemampuan dasar LLM seperti generasi autoregresif, respons streaming, dan percakapan multi-putaran, mencakup seluruh platform dari iOS 27 hingga macOS 27 hingga watchOS 27.

Secara sederhana, Core ML digunakan untuk pembelajaran mesin tradisional, sedangkan Core AI digunakan untuk model besar.

Meanwhile, the accompanying toolchain has been completely redone.

Format model .aimodel baru, paket konversi coreai-torch yang disediakan oleh Apple, ditambah fitur optimasi kinerja dan kompilasi awal di Xcode, mencakup seluruh rantai dari konversi model hingga peluncuran.

Contoh aplikasi pembelajaran bahasa.

Siswa mengangkat ponselnya mengarahkan ke seekor kolibri, SAM3 secara bersamaan menyelesaikan dua tugas di sisi perangkat: mengenali objek dalam gambar sebagai «Hummingbird» dan memisahkan kolibri dari latar belakang secara akurat, menghasilkan gambar kartu yang bersih.

Selanjutnya, model Qwen dengan 0,6 miliar parameter mengambil alih bagian teks, menggunakan hasil pengenalan untuk menghasilkan kartu kata terstruktur dengan tiga bidang: kata bahasa Tiongkok, definisi bahasa Inggris, dan contoh kalimat, masing-masing ditempatkan pada posisi yang tepat, dan mengembalikan tipe asli Swift, bukan sejumlah teks yang perlu diuraikan lagi.

Seluruh proses berjalan secara lokal di ponsel, tanpa koneksi internet dan tanpa memanggil API.

Di balik ini, ada repositori coreai-models yang dikelola resmi oleh Apple, yang berisi model open-source yang telah dioptimalkan sebelumnya seperti Qwen, Mistral, dan SAM3, semuanya telah disesuaikan untuk Apple Silicon. Pengembang dapat mengunduhnya dan menjalankannya di aplikasi mereka sendiri hanya dengan beberapa baris kode Swift.

Jika tidak ingin menggunakan yang sudah jadi, model Anda sendiri juga bisa digunakan.

Apple telah menyinkronkan paket sumber terbuka coreai-torch di GitHub, hanya dengan 5 baris Python, Anda dapat mengonversi model PyTorch menjadi format .aimodel, lalu memasukkannya ke dalam Xcode untuk dikompilasi dan dideploy.

Alamat proyek:

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

Namun, yang diinginkan Apple bukan hanya menjalankan model, tetapi menyatukan semua model.

Secara teknis, ini adalah protokol Language Model yang baru ditambahkan dalam kerangka Foundation Models. Protokol ini mendefinisikan serangkaian API Swift yang seragam, sehingga model apa pun yang mematuhi aturan ini dapat dipanggil oleh kode yang sama.

Model sisi perangkat Apple mengikuti protokol ini, model open source yang dijalankan oleh Core AI mengikuti protokol ini, dan model besar berbasis cloud seperti Claude dan Gemini juga mengikuti protokol ini.

Satu kode, tiga model, beralih mulus dari lokal ke cloud. Apple mengubah dirinya menjadi lapisan routing AI.

Memori ponsel menyimpan model besar senilai 20 miliar

Di balik Framework Foundation Models berjalan keluarga model buatan sendiri generasi ketiga AFM 3 yang dikembangkan bersama oleh Apple dan Google, dengan peluncuran sekaligus lima model.

Dua di sisi perangkat:

1. AFM 3 Core adalah model padat dengan 3B parameter, yang bertanggung jawab atas tugas ringan sehari-hari;

2. AFM 3 Core Advanced adalah model sparse dengan 20 miliar parameter, batas tertinggi di sisi perangkat Apple.

Tiga di awan:

1. AFM 3 Cloud adalah server utama;

2. ADM 3 Cloud mengkhususkan diri dalam generasi dan pengeditan gambar (di belakang Image Playground adalah itu);

3. AFM 3 Cloud Pro adalah yang terkuat di seluruh keluarga.

Di antaranya, senjata utama sisi perangkat disebut AFM 3 Core Advanced, model besar dengan 20 miliar parameter yang langsung dijalankan di ponsel.

Secara logis, memori ponsel sama sekali tidak cukup untuk menampung volume sebesar ini. Model besar tradisional memerlukan semua bobot dimuat ke dalam DRAM, 20 miliar parameter saja sudah sulit ditangani oleh perangkat desktop.

Solusi Apple untuk ini disebut Instruction-Following Pruning.

Model lengkap disimpan di flash (NAND), dan setelah menerima permintaan, modul routing ringan terlebih dahulu memilih pakar mana yang perlu diaktifkan, lalu memuat sebagian bobot tersebut ke DRAM. Jumlah parameter yang benar-benar dipanggil setiap kali berkisar antara 1 miliar hingga 4 miliar, tergantung pada kompleksitas tugas.

Model dengan 20 miliar parameter, saat bekerja hanya menggunakan 5% hingga 20%, sisanya diam-diam berada di flash storage menunggu dipanggil.

Di sisi cloud, ini adalah model server terkuat Apple—AFM 3 Cloud Pro.

Untuk mengatasi penalaran kompleks dan pemanggilan alat Agent, Apple bekerja sama dengan Google dan NVIDIA, memperluas Private Cloud Compute ke GPU NVIDIA di Google Cloud. Aturan privasi tetap berlaku, data tidak keluar dari wilayah.

Hasil pengujian nyata juga mendukung efektivitas arsitektur ini.

AFM 3 Core dinilai lebih unggul daripada generasi sebelumnya pada 45,6% prompt pengujian, sementara keunggulan generasi sebelumnya hanya 23,3%. Di cloud, selisih AFM 3 Cloud bahkan lebih ekstrem, yaitu 64,7% melawan 8,7%, hampir sepenuhnya mendominasi.

Arsitektur dan skor sudah dibahas, sekarang pertanyaan yang paling diperhatikan pengembang: sistem ini berapa harganya?

Jika unduhan pertama aplikasi Anda di App Store di bawah 2 juta, komputasi awan pribadi untuk inferensi awan sepenuhnya gratis, tanpa biaya API, tanpa biaya token. Anda cukup fokus menulis aplikasi.

Dapat dikatakan bahwa ambang ini secara tepat berada pada posisi pengembang independen dan tim kecil-menengah.

Tiga baris kode, Claude sudah di meja

Dalam adaptasi pihak ketiga yang dirilis secara publik, Anthropic adalah yang pertama menyerahkan hasilnya.

Pada hari yang sama ketika keynote WWDC berakhir pada 8 Juni, Anthropic segera merilis paket Swift, secara resmi mengintegrasikan kerangka Foundation Models, dan tersedia mulai 9 Juni.

Idenya sederhana.

Model sisi perangkat Apple unggul dalam tugas ringan seperti ringkasan, ekstraksi informasi, dan klasifikasi, cepat, tidak memerlukan koneksi internet, dan tanpa biaya. Namun, ketika menghadapi kebutuhan kompleks seperti penalaran multi-langkah, generasi kode, atau pencarian online, model sisi perangkat tidak mampu menanganinya.

Sedangkan paket Swift Claude justru tepat berada di jahitan ini.

Developer secara normal memanggil model sisi perangkat Apple dalam kerangka Foundation Models; ketika tugas melebihi kemampuan sisi perangkat, kerangka secara otomatis mengarahkan permintaan ke Claude, dan hasil respons dikembalikan dalam bentuk streaming ke tampilan SwiftUI yang sama.

Pengguna tidak merasakan peralihan sama sekali; bagi mereka, ini hanyalah satu aplikasi.

Dengan kata lain, jika aplikasi catatan atau aplikasi pembelajaran yang sering kamu gunakan tiba-tiba menjadi lebih cerdas dan mampu melakukan analisis semantik lintas dokumen, kemungkinan besar pengembangnya telah mengintegrasikan paket ini.

Misalnya, sebuah aplikasi jurnal dapat menggunakan model sisi perangkat untuk menghasilkan petunjuk penulisan harian, tetapi ketika pengguna bertanya, "Apa tema umum dari jurnal beberapa bulan terakhir?", induksi semantik lintas-waktu ini secara otomatis ditangani oleh Claude.

Namun, peluncuran Anthropic di ekosistem Apple tidak berhenti di sini.

Claude Agent telah diintegrasikan ke dalam Xcode 26.3 sejak Februari tahun ini, membantu pengembang menulis kode, menjalankan pengujian, dan melakukan otomatisasi.

Namun, Claude di Xcode ditujukan untuk pengembang itu sendiri, sedangkan Claude di Foundation Models ditujukan untuk pengguna akhir aplikasi.

Ini adalah tiket masuk distribusi konsumen yang terlambat tapi penting bagi Anthropic.

Claude terus bergerak agresif di pasar pengembang dan perusahaan, tetapi hampir tidak memiliki kehadiran di depan konsumen umum.

Kali ini, kerangka Foundation Models dari Apple memberinya saluran untuk menjangkau satu miliar pengguna.

2,5 miliar perangkat, satu arena

Melihat seluruh tindakan WWDC terakhir Cook, satu benang merah menghiasi semuanya.

Apple tidak ingin menjadi perusahaan model AI. Ia menyerahkan otak Siri ke Google, menjalankan model open-source melalui Core AI, dan memberikan keputusan pilihan AI pihak ketiga kepada pengguna.

Yang harus dilakukannya adalah arena.

2,5 miliar perangkat, protokol Language Model yang seragam, kerangka pengaturan lengkap dari perangkat hingga cloud.

Siapa pun yang memiliki model terbaik akan dapat menjangkau kelompok pengguna bernilai tinggi terbesar di dunia melalui platform ini.

Persaingan di antara raksasa AI kini memiliki dimensi baru mulai hari ini.

Sebelumnya, Anthropic dan OpenAI bersaing dalam volume panggilan API, alat pengembang, dan kontrak perusahaan.

Sekarang Apple membawa medan pertempuran ke saku setiap orang, siapa yang bisa merebut posisi "mesin AI default", dialah yang akan menang di putaran berikutnya.

Pada 1 September, John Ternus mengambil alih posisi CEO Apple. Ia mewarisi bukan hanya sebuah perusahaan perangkat keras, tetapi juga arena AI yang ditinggalkan oleh Cook.

Apple Meluncurkan Kerangka Kerja AI Inti di WWDC, Menggantikan Core ML Setelah 9 Tahun

Apple memberikan garis yang sama untuk semua AI

Memori ponsel menyimpan model besar senilai 20 miliar

Tiga baris kode, Claude sudah di meja

2,5 miliar perangkat, satu arena