
Vào giữa tháng 6, ba sự kiện ngành dường như độc lập: Fable 5 gặp hạn chế tuân thủ, GLM-5.2 công bố mã nguồn mở, GPT-5.6 bị rò rỉ và phát hành nút, đang đưa ngành AI toàn cầu đến một mốc phân kỳ. Nhìn thấu ba biến động này, logic vận hành nền tảng của ngành đã trải qua sự tái cấu trúc thực chất:
Đầu tiên, trọng số “khả năng sử dụng” vượt trội đáng kể so với “tính tiên tiến”, chuỗi cung ứng mô hình lớn toàn cầu chính thức bước vào giai đoạn “hai轨” với sự song song giữa việc kiểm soát nguồn đóng và nguồn mở tại địa phương;
Thứ hai, rào cản cạnh tranh của các đế chế nguồn đóng đang chuyển dịch, trọng tâm công nghệ đang từ “trí tuệ ngôn ngữ” chuyển sang “trí tuệ không gian (mô hình thế giới)” phụ thuộc nặng vào sức tính toán;
Thứ ba, trước các rủi ro tuân thủ xuyên biên giới thường trực, thiết kế tách rời mang tính “độc lập với mô hình” đã trở thành ranh giới sống còn để các nhà phát triển ứng dụng duy trì tính liên tục của hoạt động kinh doanh.
Fable 5 delisting
Ngày 18 tháng 6, theo tiết lộ, cơ quan quản lý địa phương và Anthropic đã bắt đầu soạn thảo một khung rủi ro chung. Đồng thời, tại hội nghị G7 Évian-les-Bains vừa kết thúc, các đại biểu đã thảo luận về việc thiết lập cơ chế danh sách trắng công nghệ xuyên biên giới. Do trước đó Thủ tướng Canada Mark Carney đã cảnh báo các nước thành viên G7 về “rủi ro hệ thống do phụ thuộc quá mức vào nhà cung cấp AI ở một khu vực duy nhất”, chủ đề trọng tâm của cuộc họp này tập trung vào việc tìm cách đảm bảo các doanh nghiệp xuyên biên giới có kênh truy cập ổn định vào các mô hình AI nền tảng trong bối cảnh tuân thủ xuất khẩu công nghệ đang trở nên nghiêm ngặt hơn.
Sự kiện trực tiếp gây ra cuộc thảo luận ở cấp độ ngoại giao và tuân thủ là mô hình Claude Fable 5, bị kiểm soát sau chỉ 72 giờ ra mắt.
Là sản phẩm đầu tiên mà Anthropic mở rộng khả năng tiên tiến cấp "Mythos" cho công chúng, Fable 5 đã thể hiện các chỉ số kỹ thuật nổi bật ngay từ ngày ra mắt 9 tháng Sáu: trong các bài kiểm tra kỹ thuật do Stripe thực hiện, mô hình này đã thực hiện thành công việc di chuyển liền mạch 50 triệu dòng mã Ruby trong vòng một ngày — trước đây, công việc tương đương cần cả đội ngũ kỹ sư vận hành hơn hai tháng; trong các bài kiểm tra thị giác đa phương tiện mù, nó chỉ dựa vào ảnh chụp màn hình mà không cần dữ liệu trạng thái trò chơi để hoàn thành trò chơi Pokémon FireRed. Giá của nó là 50 đô la Mỹ mỗi triệu token đầu ra, giảm hơn một nửa chi phí so với phiên bản trước đó.
Tuy nhiên, chỉ sau 72 giờ kể từ khi sản phẩm ra mắt, Bộ Thương mại Hoa Kỳ đã ban hành lệnh dựa trên quy định kiểm soát xuất khẩu, yêu cầu hạn chế việc truy cập mô hình này đối với bất kỳ người dùng nước ngoài và công dân không phải Mỹ. Hiện tại, doanh nghiệp AI định giá 965 tỷ USD này đã thực hiện các biện pháp hạn chế truy cập sản phẩm, và đội ngũ kỹ sư cấp cao cùng ban lãnh đạo sẽ có cuộc gặp trực tiếp với các cơ quan quản lý tại Washington vào ngày 22 tháng 6.
Từ các chi tiết cụ thể của quy định, cơ quan quản lý không yêu cầu hoàn tác toàn bộ sản phẩm, mà rõ ràng giới hạn phạm vi hạn chế ở quyền truy cập của “công dân không phải Mỹ”. Điều này có nghĩa là trọng tâm của can thiệp hành chính không nằm ở việc sửa chữa phần mềm truyền thống, mà ở việc ngăn chặn công nghệ lan rộng, tức là ngăn chặn các mô hình tiên tiến bị bên ngoài khai thác thông qua kỹ thuật đảo ngược do hệ thống bảo vệ an toàn bị mất hiệu lực trong quá trình được truy cập rộng rãi.
Hành động này thiết lập một thực tại mới, trong khuôn khổ tuân thủ hiện hành, sự gia tăng năng lực công nghệ đi kèm với mức độ rủi ro quản lý tương đương, và tính tiên tiến công nghệ của mô hình nền tảng có thể bị hạn chế bất cứ lúc nào do yêu cầu tuân thủ ở cấp độ thương mại địa chính trị.
Hedging chuỗi cung ứng từ cộng đồng mã nguồn mở
Trong khi các mô hình nguồn đóng gặp khoảng trống truy cập do yêu cầu tuân thủ, các mô hình nguồn mở đang mở rộng thị phần nhờ hiệu suất ổn định cải thiện và lợi thế chi phí rõ rệt.
Ngày 17 tháng 6, Zhipu AI công bố GLM-5.2 đã chính thức được mở nguồn theo giấy phép MIT. Mô hình này đạt điểm 51 trong đánh giá tổng hợp Artificial Analysis và hỗ trợ cửa sổ ngữ cảnh khả dụng lên đến 1 triệu token. Trong hệ thống kiểm tra mù Code Arena với hơn 1 triệu người dùng tham gia, GLM-5.2 đã thể hiện hiệu suất gần với các mô hình hàng đầu truyền thống như Claude Opus 4.8 trong nhiều nhiệm vụ dài hạn (Agentic Tasks) và bài đánh giá mã hóa dài hạn SWE-Marathon.
Trên nền tảng năng lực tính toán cơ sở, GLM-5.2 đã đạt được sự tương thích hoàn toàn với các nền tảng năng lực tính toán trong nước phổ biến như Pingtouge, Cambricon và Hailong, xác minh tính khả thi của việc liên tục cải tiến các mô hình lớn tiên tiến mà không phụ thuộc vào hệ sinh thái bán dẫn nước ngoài hiện có.

Ở cấp độ mô hình kinh doanh, thế hệ mô hình mã nguồn mở hiện tại đang thúc đẩy sự tái cấu trúc nhu cầu do chi phí dẫn dắt. Theo báo cáo nghiên cứu chung năm 2026 của MIT Sloan và Trường Kinh doanh Haas, việc chuyển từ API đóng sang mô hình mã nguồn mở—“phân bổ lại nhu cầu tối ưu”—trung bình giúp các doanh nghiệp đa quốc gia giảm hơn 70% chi phí suy luận AI, tiết kiệm khoảng 25 tỷ USD mỗi năm cho nền kinh tế AI toàn cầu. Về mặt độ dốc tiến hóa công nghệ, khoảng cách hiệu suất chuẩn giữa mô hình mã nguồn mở và đóng vào cuối năm 2023 gần 18 điểm phần trăm, nhưng đến năm 2026, các mô hình mã nguồn mở như Qwen 3.5 đã đạt 88,4 điểm trên bộ tiêu chuẩn suy luận khoa học (GPQA Diamond), gần ngang bằng với hầu hết các lựa chọn đóng.
Khi khoảng cách hiệu năng thu hẹp xuống dưới 10% và chi phí giảm xuống còn một phần mười, logic thay thế trên thị trường thương mại bắt đầu phát huy tác dụng. Đối với các doanh nghiệp toàn cầu, các mô hình mã nguồn mở như GLM-5.2 hỗ trợ triển khai riêng tư tại địa phương không chỉ là lựa chọn kỹ thuật thay thế, mà còn là biện pháp dự phòng trong quản lý rủi ro tuân thủ thương mại xuyên biên giới. Khi Musk dự đoán trên nền tảng X rằng AI Trung Quốc sẽ bắt kịp khả năng cấp Fable vào quý đầu tiên năm 2027, CEO Zhipu AI Đường Kiệt đã phản hồi ngắn gọn: “Không lâu đến vậy”, và cơ sở của ông chính là tiến độ của chuỗi công nghiệp khép kín ở cấp độ kỹ thuật.

Sự chuyển trọng tâm của GPT-5.6
Để đối phó với sự thu hẹp khoảng cách về khả năng ngôn ngữ và mã nguồn của các mô hình mã nguồn mở, các bên đóng nguồn đang tăng tốc tái cấu trúc rào cản công nghệ.
Nhiều nhà phát triển đã thu thập được các mục ánh xạ trỏ đến "gpt-5.6" từ nhật ký định tuyến của Codex thuộc OpenAI. Mô hình này trước đây đã chính xác xác nhận các thời điểm ra mắt của GPT-5.4 và GPT-5.5. Trên Polymarket, xác suất hợp đồng "GPT-5.6 sẽ được ra mắt trước ngày 30 tháng 6" hiện đang ổn định trong khoảng 80% đến 89%, cho thấy dữ liệu thị trường kỳ vọng tiến độ ra mắt của nó sẽ không bị trì hoãn đáng kể bởi các sự cố quản lý gần đây.
Các chi tiết kỹ thuật bị rò rỉ cho thấy trọng tâm nâng cấp của GPT-5.6 đã chuyển từ “trí tuệ ngôn ngữ” truyền thống sang “trí tuệ không gian (mô hình thế giới)”. Theo báo cáo, OpenAI đã tăng tham số suy luận nội bộ “Juice Value” từ 768 lên 960, đổi lấy chất lượng đầu ra chính xác hơn bằng cách kéo dài chuỗi suy luận nội bộ và hy sinh thời gian phản hồi đơn lẻ; đồng thời, cửa sổ ngữ cảnh được nâng từ 1 triệu token lên 1,5 triệu token, mở rộng không gian xử lý cho các luồng làm việc đa bước Agentic thêm 50%.
Điều có ý nghĩa chỉ báo thương mại lớn hơn là hiệu suất của nó trong việc hiểu không gian 3D, tạo cảnh, hoạt họa vật lý và tạo mã SVG. Phản hồi từ bài kiểm tra cho thấy GPT-5.6 Pro đã gần đạt đến mức của Fable 5 bị hạn chế trong các nhiệm vụ mô phỏng vật lý và tạo trình biên dịch WebGL.
Chiến lược của con đường công nghệ này rất rõ ràng: trong bối cảnh rào cản kỹ thuật đối với văn bản và công nghệ mã hóa phổ quát dần bị xóa bỏ bởi cộng đồng mã nguồn mở, các ông lớn đóng nguồn đang chuyển trọng tâm sang lĩnh vực “mô hình thế giới” đòi hỏi lượng tính toán khổng lồ, sự đồng bộ đa mô态 phức tạp cao và khả năng mô phỏng không gian vật lý. Bằng cách xác lập sự khác biệt thế hệ mới trong các bối cảnh như mô phỏng công nghiệp, đào tạo robot và thiết kế 3D, họ đang tái xác minh khả năng tạo giá trị thương mại của các API đóng nguồn.
Logic nền tảng của chuỗi cung ứng mô hình lớn đã được chuyển đổi vào mùa hè năm 2026. Tiêu chí đánh giá cơ sở hạ tầng nền tảng của doanh nghiệp đang chuyển từ các chỉ số hiệu suất đơn lẻ sang đánh giá tổng hợp giữa hiệu suất và tuân thủ chính sách.
Các ông lớn đóng nguồn đang sử dụng mô hình thế giới và trí tuệ không gian để tái định nghĩa ranh giới công nghệ, nỗ lực xây dựng lợi thế thế hệ mới trong lĩnh vực công nghiệp và robot. Tuy nhiên, trải nghiệm của Fable 5 chứng minh rằng, bất kể công nghệ tiến hóa đến đâu, khả năng sử dụng sản phẩm vẫn bị giới hạn trước các ràng buộc tuân thủ hành chính thường trực. Sự dẫn đầu về công nghệ không còn là yếu tố duy nhất đảm bảo hoạt động kinh doanh; sự tuân thủ và ổn định trong khả năng truy cập đã trở thành những điều kiện tiên quyết ngang tầm nhau.
Đối với các nhà phát triển và doanh nhân ứng dụng AI, việc gắn kết hoàn toàn luồng nghiệp vụ cốt lõi vào API đóng của một nhà cung cấp mô hình duy nhất đồng nghĩa với việc để doanh nghiệp đối mặt với rủi ro bên ngoài không thể kiểm soát ở mức cực cao. Việc thiết kế kiến trúc hệ thống cốt lõi để đạt được sự “giải耦 mô hình (Model-agnostic)” triệt để, đảm bảo rằng nghiệp vụ có thể chuyển đổi liền mạch trong thời gian ngắn từ các giải pháp bị hạn chế về pháp lý sang các phương án thay thế mở nguồn tại chỗ và kiểm soát được nguồn cung, đã không còn là lý thuyết kiến trúc đơn thuần, mà là ranh giới tối thiểu cơ bản nhất mà doanh nghiệp cần duy trì để đảm bảo tính liên tục của hoạt động. (Bài viết này lần đầu tiên xuất hiện trên ứng dụng Titanium Media, tác giả | AGI-Signal, biên tập | Qin Conghui)
