
Pertengahan Jun, tiga peristiwa industri yang kelihatan bebas: Fable 5 mengalami penghambatan pematuhan, GLM-5.2 mengumumkan sumber terbuka, dan GPT-5.6 bocor dengan nod pelancaran, sedang membawa industri AI global ke satu titik peralihan. Melihat tiga perubahan ini, logik operasi asas industri telah mengalami rekonstruksi yang substantif:
Pertama, timbangan "ketersediaan" secara signifikan melebihi "kecanggihan", rantai pasokan model besar global secara rasmi memasuki peringkat "dua saluran" yang terdiri daripada penutupan terkawal dan sumber terbuka tempatan;
Kedua, rintangan persaingan raksasa sumber tertutup berpindah, dengan fokus teknologi beralih dari "kecerdasan bahasa" ke "kecerdasan ruang (model dunia)" yang sangat bergantung pada daya pengiraan;
Ketiga, menghadapi risiko kepatuhan antar negara yang biasa berlaku, reka bentuk pemisahan yang bebas model telah menjadi garis dasar kehidupan bagi pembangun lapisan aplikasi untuk mengekalkan kesinambungan perniagaan.
Fable 5 ditarik
Pada 18 Jun, dilaporkan bahawa pihak pengawal tempatan dan Anthropic telah mula menyusun kerangka risiko bersama. Sementara itu, pada puncak G7 Évian-les-Bains di Perancis yang baru berakhir, perwakilan membincangkan pembinaan mekanisme senarai putih teknologi antarabangsa. Disebabkan Perdana Menteri Kanada Mark Carney sebelum ini telah memperingatkan ahli G7 mengenai “risiko sistemik akibat ketergantungan berlebihan kepada pembekal AI dari satu kawasan sahaja”, isu utama pertemuan ini berpusat pada mengkaji jaminan akses stabil kepada model AI asas oleh perusahaan antarabangsa dalam konteks pengetatan kepatuhan eksport teknologi.
Peristiwa langsung yang memicu perbincangan di peringkat diplomatik dan kepatuhan ialah model Claude Fable 5 yang mengalami pengawasan selepas 72 jam pelancaran.
Sebagai produk pertama yang diperkenalkan oleh Anthropic untuk membuka kemampuan mutakhir tingkat "Mythos" kepada publik, Fable 5 menunjukkan indikator kejuruteraan yang ketara sejak pelancarannya pada 9 Jun, di mana model ini berjaya melakukan pemindahan tanpa gangguan terhadap kodbase Ruby sebanyak 50 juta baris dalam sehari semasa ujian kejuruteraan yang dijalankan oleh Stripe (sebelum ini, kerja yang sama memerlukan pasukan jurutera penuh lebih daripada dua bulan); dalam ujian buta visual multimodal, ia mampu menyelesaikan Pokémon FireRed hanya berdasarkan tangkapan skrin tanpa bergantung pada data keadaan permainan. Harganya ialah $50 setiap juta token output, mengurangkan kos lebih daripada separuh berbanding versi sebelumnya.
Namun, hanya 72 jam selepas pelancaran produk, Departemen Perdagangan Amerika Syarikat mengeluarkan arahan berdasarkan peraturan kawalan eksport, memerlukan sekatan akses kepada mana-mana pengguna asing dan bukan warganegara Amerika terhadap model tersebut. Kini, syarikat AI bernilai US$965 bilion ini telah melaksanakan sekatan akses produk, dan jurutera serta pasukan eksekutif tinggi akan bertemu dengan pihak pengawal di Washington pada 22 Jun.
Dari butir-butir peraturan yang spesifik, pihak berkuasa tidak memerlukan rollback keseluruhan sistem, tetapi secara jelas membatasi lingkup pembatasan kepada akses oleh "bukan warga Amerika". Ini bermakna inti intervensi pentadbiran bukan pada pembaikan teknis perisian tradisional, tetapi pada pencegahan penyebaran teknologi, iaitu mencegah model canggih daripada diakses secara luar melalui reka bentuk songsang apabila pelindung keselamatan gagal semasa pemanggilan meluas.
Tindakan ini menetapkan realiti baru, di mana dalam kerangka pematuhan semasa, pertumbuhan kemampuan teknikal disertai dengan risiko pengawasan yang setara, dan kecanggihan teknikal model asas boleh dibatasi sewaktu-waktu kerana keperluan pematuhan di peringkat perniagaan geopoliitik.
Hedging rantai bekalan dari komuniti sumber terbuka
Di titik di mana model tertutup mengalami kekosongan akses akibat keperluan pematuhan, kumpulan sumber terbuka sedang memperluas pangsa pasaran melalui peningkatan prestasi yang stabil dan kelebihan kos yang jelas.
Pada 17 Jun, Zhipu AI mengumumkan bahawa GLM-5.2 secara rasmi dibuka sumber dengan lesen MIT. Model ini mendapat skor 51 dalam penilaian komprehensif Artificial Analysis, dengan jendela konteks yang boleh digunakan sebanyak 1 juta token. Dalam sistem ujian buta Code Arena yang melibatkan lebih daripada 1 juta pengguna, GLM-5.2 menunjukkan prestasi yang hampir setara dengan model unggul tradisional seperti Claude Opus 4.8 dalam pelbagai tugas jangka panjang (Agentic Tasks) dan penilaian pengkodean jangka panjang SWE-Marathon.
Dalam kekuatan pengiraan dasar, GLM-5.2 telah mencapai keserasian penuh dengan platform kekuatan pengiraan tempatan utama seperti Pingtouge, Cambricon, dan Hailong, membuktikan kebolehan berterusan mengembangkan model besar terkini tanpa bergantung pada ekosistem semikonduktor luar negara.

Pada aras perniagaan, model sumber terbuka generasi ini sedang mendorong semula permintaan yang didorong oleh kos. Laporan bersama dari MIT Sloan dan Sekolah Perniagaan Haas pada 2026 menunjukkan bahawa “pengagihan semula permintaan optimum” daripada API tertutup kepada model sumber terbuka secara purata boleh mengurangkan kos inferens AI sebanyak lebih 70% bagi syarikat antarabangsa, serta menjimatkan kira-kira US$25 bilion setahun kepada ekonomi AI global. Dari segi kecenderungan perkembangan teknologi, jurang prestasi piawai antara model sumber terbuka dan tertutup pada akhir 2023 hampir 18 peratus, tetapi pada 2026, model sumber terbuka seperti Qwen 3.5 mencapai skor 88.4 dalam piawai inferens sains (GPQA Diamond), sudah hampir setara dengan kebanyakan pilihan tertutup.
Apabila jurang prestasi menyempit kepada kurang daripada 10% dan kos turun menjadi sepuluh kali ganda lebih rendah, logik penggantian pasaran komersial mula berfungsi. Bagi perusahaan global, model open-source seperti GLM-5.2 yang menyokong pelaksanaan persendirian secara tempatan bukan sahaja pilihan teknikal, tetapi juga cadangan redundan dalam pengurusan risiko pematuhan perdagangan antarabangsa. Apabila Musk meramalkan di platform X bahawa AI China akan mengejar kesetaraan kemampuan kelas Fable pada Q1 2027, CEO Zhipu, Tang Jie, memberi respons ringkas “tidak sepanjang itu”, dan dasar beliau berasaskan kemajuan kitaran industri di peringkat kejuruteraan ini.

Peralihan fokus GPT-5.6
Untuk menghadapi pendekatan model sumber terbuka dalam kemampuan bahasa dan kod, pihak tertutup sedang mempercepat semula pembinaan rintangan teknikal.
Banyak pembangun mengambil entri pemetaan yang menunjuk ke "gpt-5.6" daripada log laluan Codex OpenAI. Pola ini sebelum ini telah mengesahkan dengan tepat titik pelancaran sebelum pelancaran GPT-5.4 dan GPT-5.5. Polymarket meramalkan bahawa kebarangkalian kontrak "GPT-5.6 akan dilancarkan sebelum 30 Jun" kini stabil antara 80% hingga 89%, dengan data pasaran menunjukkan bahawa ekspektasi pasaran adalah bahawa jadual pelancarannya tidak akan mengalami penundaan yang signifikan akibat kemelut peraturan terkini.
Butiran teknikal yang bocor menunjukkan bahawa penekanan pengupayaan GPT-5.6 telah berpindah dari “kecerdasan bahasa” tradisional kepada “kecerdasan ruang (model dunia)”. Dilaporkan bahawa OpenAI telah meningkatkan parameter penalaran dalaman “Juice Value” dari 768 kepada 960, dengan memanjangkan rantai penalaran dalaman dan mengorbankan masa respons sekali gus, demi meningkatkan kualiti output yang lebih tepat; sementara itu, tetingkap konteksnya telah dinaikkan dari 1 juta token kepada 1.5 juta token, memperluaskan ruang pemprosesan alur kerja agen berbilang langkah sebanyak 50%.
Yang lebih bermakna sebagai penanda arah perniagaan ialah prestasinya dalam pemahaman ruang 3D, penghasilan adegan, animasi fizikal, dan penghasilan kod SVG. Maklum balas ujian menunjukkan bahawa GPT-5.6 Pro telah hampir mencapai Fable 5 yang terhad dalam tugas simulasi fizikal dan penciptaan WebGL renderer.
Niat strategik jalan teknikal ini jelas: dalam konteks di mana rintangan teknikal teks dan teknik pengkodan am sudah semakin diratakan oleh kumpulan sumber terbuka, raksasa tertutup sedang memindahkan medan utama mereka ke bidang “model dunia” yang memerlukan penggunaan kuasa pengiraan yang besar, penyelarasan multimodal yang sangat kompleks, dan simulasi ruang fizikal. Dengan menubuhkan perbezaan generasi baharu dalam skenario simulasi industri, latihan robot, dan reka bentuk 3D, mereka ingin mengesahkan semula keupayaan komersial API tertutup untuk memberi nilai tambah.
Logik asas rantai bekalan model besar telah berubah pada musim panas 2026. Ukuran yang digunakan oleh perusahaan untuk menilai infrastruktur asas sedang berubah daripada indikator prestasi tunggal kepada penilaian komprehensif yang menggabungkan prestasi dan kepatuhan polisi.
Raksasa sumber tertutup sedang menggunakan model dunia dan kecerdasan ruang untuk semula menentukan sempadan teknologi, cuba membina keunggulan generasi baharu dalam industri dan robotik. Namun, pengalaman Fable 5 membuktikan bahawa, sekalipun teknologi terus berkembang, ketersediaan produknya masih terhad oleh batasan kepatuhan pentadbiran yang biasa. Kepimpinan teknologi bukan lagi satu-satunya jaminan untuk mengekalkan perniagaan; kepatuhan dan kestabilan akses kini menjadi syarat awal yang sama pentingnya.
Bagi pembangun dan usahawan peringkat aplikasi AI, mengikatkan aliran bisnis utama sepenuhnya kepada API tertutup dari satu pembekal model bermakna mengekspos bisnes kepada risiko luaran yang tidak boleh dikawal yang sangat tinggi. Dalam reka bentuk struktur asas sistem, mencapai “pengasingan model (Model-agnostic)” yang menyeluruh untuk memastikan bisnes dapat berpindah tanpa gangguan dalam masa singkat daripada penyelesaian yang terhad secara pematuhan kepada pilihan alternatif terbuka tempatan dengan bekalan yang boleh dikawal, bukan lagi sekadar teori reka bentuk, tetapi garis paling asas yang perlu dipatuhi oleh syarikat untuk mengekalkan kesinambungan bisnes. (Artikel ini pertama kali diterbitkan di aplikasi Titanium Media, penulis | AGI-Signal, penyunting | Qin Conghui)
