ByteDance, Alibaba, Tencent mở rộng việc tổng hợp mô hình trong dịch vụ đám mây

Ngày gần đây, Kế hoạch Coding Plan của Volcano Engine, thuộc ByteDance, chính thức ra mắt GLM-5.1, với thông báo chính thức rằng “đồng bộ đầy đủ năng lực gốc nhà sản xuất, không giới hạn số lượng”. Trước đó, Kế hoạch Coding Plan của Volcano chỉ bao gồm các mô hình cũ hơn như GLM-4.7. Cập nhật lần này không chỉ giới thiệu GLM-5.1, mà còn tích hợp nhiều mô hình lớn trong nước mới nhất như Minimax M2.7, Kimi k2.6 và DeepSeek-V3.2.

Kimi

Điều này có nghĩa là các nhà phát triển chỉ cần một khoản phí đăng ký để đồng thời truy cập nhiều mô hình hàng đầu. Theo phản hồi từ thị trường, mô hình “gói dịch vụ” này đã giảm đáng kể chi phí thử nghiệm của các nhà phát triển. Hiện tại, gói Lite có giá 40 nhân dân tệ mỗi tháng, gói Pro có giá 200 nhân dân tệ mỗi tháng, giúp nhiều nhà phát triển sẵn sàng “mua trước để giữ chỗ”.

Chính GLM-5.1 của ZhiPu đã thể hiện khả năng kỹ thuật ấn tượng trong một bản cập nhật vào đầu tháng 4 năm 2026. Trong hai video chính thức do ZhiPu phát hành, “Xây dựng desktop Linux từ con số 0 trong 8 giờ” và “655 vòng lặp lặp lại, tăng thông lượng truy vấn cơ sở dữ liệu vector lên 6,9 lần so với phiên bản chính thức ban đầu” đã làm mới hoàn toàn nhận thức của công chúng về khả năng “thực thi hiệu quả trong 8 giờ” của các mô hình lớn.

Phóng viên khảo sát thực địa cộng đồng nhà phát triển, đa số người dùng cho biết “không bền”

Phóng viên tham gia vào nhóm trao đổi phát triển của Ark Coding và phát hiện rằng, ngoài các bài đăng chia sẻ trải nghiệm, rất nhiều người dùng phản ánh sự chênh lệch giữa kỳ vọng và thực tế. Chỉ cần lướt vài trang cộng đồng trao đổi sẽ thấy, các bài đăng khiếu nại và yêu cầu hoàn tiền rất nhiều, nhiều người dùng trực tiếp bày tỏ: “Cảm giác bị lừa”.

Kimi

Có hai điểm tranh cãi chính:

Một vấn đề liên quan đến việc sử dụng hạn mức quá nhanh. Một người dùng có tên “Hakimi” đã đăng bài cho biết: “Một nhiệm vụ, sau vài cuộc hội thoại, hạn mức 5 giờ đã sắp hết”, và một người dùng khác cũng chia sẻ nguyên nhân khiến hạn mức 5 giờ của họ bị kích hoạt là do tài khoản liên tục lướt cửa sổ trong vòng 5 giờ liên tục, số lượng yêu cầu thực tế đã vượt quá 6.004 lần, vượt quá hạn mức hệ thống.

Kimi

Thứ hai là trải nghiệm suy giảm do áp lực lên việc điều phối sức mạnh tính toán. Nhiều người dùng phản ánh gặp lỗi 429 (yêu cầu quá nhiều) và “trễ ký tự đầu tiên hơn 1 phút là chuyện bình thường trong giờ cao điểm”. Một người dùng thẳng thắn cho biết: “Giới hạn 5 giờ bị kích hoạt quá thường xuyên, không thể dùng để phát triển nghiêm túc.”

Đồng thời, đằng sau mức giá thấp chỉ 40 nhân dân tệ mỗi tháng của gói Coding Plan, cũng ẩn chứa những “dòng chảy ngầm” về “một yêu cầu gọi” dẫn đến các hệ số khấu trừ khác nhau. Ví dụ, một người dùng đã đăng hình ảnh “sự khác biệt hệ số khấu trừ khi gọi các mô hình khác nhau” trong nhóm trao đổi nhà phát triển. Ví dụ, hệ số khấu trừ của toàn bộ dòng豆包 và dòng Qwen là 1 lần, dòng DeepSeek là 2 lần, dòng MiniMax-M2.7, Kimi-K2.6 và GLM-5.1 là 5 lần.

Kimi

Điều này cũng cho thấy việc xây dựng “siêu thị mô hình” không dễ dàng như tưởng tượng; các nhà phát triển bị thu hút bởi yếu tố “chi phí - hiệu quả”, nhưng những hạn chế ban đầu về quản lý năng lực tính toán đã khiến nhiều người sau khi thử nghiệm đã chọn từ bỏ. Điều này cũng phơi bày những cơn đau đầu giai đoạn đầu của mô hình “đóng gói”. Khi người dùng tràn vào, khả năng chịu tải của nền tảng năng lực tính toán đang đối mặt với thách thức. Làm thế nào để tìm được điểm cân bằng bền vững giữa việc thu hút giá thấp và chất lượng dịch vụ sẽ là bài toán lâu dài mà VolcEngine và những người theo sau cần giải quyết.

Các nhà cung cấp đám mây đồng loạt chuyển sang “siêu thị mô hình”, bước đầu xuất hiện sự phân tầng và cố định

Cập nhật "tích hợp" lần này của Kế hoạch Coding của Volcano Engine cũng không phải là sự kiện cô lập.

Từ đầu năm 2026, các nhà cung cấp đám mây chính như Alibaba Cloud, Baidu Intelligent Cloud và Tencent Cloud đều đang thúc đẩy chiến lược tích hợp đa mô hình. Ví dụ, Alibaba Cloud, với vai trò tiên phong trong ngành, đã sớm ra mắt gói đăng ký đa mô hình “Bailian Coding Plan”. Hiện tại, gói này hỗ trợ các mô hình trong chuỗi Qwen cùng với kimik-k2.5, glm-5, MiniMax-M2.5, v.v. Giá Pro hiện tại là 200 nhân dân tệ mỗi tháng; gói Lite đã ngừng bán mới kể từ ngày 20 tháng 3 và ngừng gia hạn cũng như nâng cấp kể từ ngày 13 tháng 4.

Kimi

Dịch vụ đăng ký mô hình lớn của Tencent Cloud dành cho lập trình sẽ được cập nhật toàn diện vào tháng 3 năm 2026, hỗ trợ các mô hình mới nhất như Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5, v.v. Baidu Qianfan chính thức ra mắt dịch vụ đăng ký AI coding vào tháng 2 năm 2026, cũng là một trong những nhà cung cấp đám mây đầu tiên tại Trung Quốc cung cấp dịch vụ này.

Mô hình “siêu thị mô hình” không còn là lựa chọn của riêng ai, mà đang trở thành lĩnh vực mà các nhà cung cấp đám mây đều cạnh tranh nhau triển khai. Nhưng khi bóc tách lớp vỏ chiến lược tập trung của các nhà cung cấp đám mây, ai có thể cung cấp dịch vụ ổn định hơn, quy tắc hạn mức minh bạch hơn, cơ chế ứng phó sự cố linh hoạt hơn, và ai có thể mở rộng thêm nhiều服务能力 cấp doanh nghiệp ngoài lập trình, liệu tỷ lệ gia hạn có theo kịp không — đều trở thành những trung tâm cạnh tranh mới.

Trên thế giới, các nền tảng tích hợp mô hình của Amazon Bedrock và Microsoft Azure khác với bối cảnh đăng ký Coding ở trong nước, nhưng đều thuộc xu hướng tích hợp.

Kimi

Nhìn chung, cạnh tranh trong ngành đang chuyển từ việc so sánh năng lực của mô hình đơn lẻ sang cạnh tranh về khả năng tích hợp nền tảng và dịch vụ hệ sinh thái, dẫn đến mức độ tập trung ngành sẽ tăng nhanh.

Chuyên gia phân bổ tài sản hàng đầu của Công ty Chứng khoán Quốc Tín, Vương Khai, cho biết mặc dù sự phân hóa ngành đang gia tốc, nhưng việc đưa ra kết luận về giai đoạn tích hợp có thể hơi vội vàng. “Nói chính xác hơn, đây là sự tinh细化 và lặp lại của phân công chuỗi công nghiệp. Các nhà cung cấp mô hình tập trung vào thuật toán, các nhà cung cấp đám mây tập trung vào việc triển khai kỹ thuật, mỗi bên phát huy lợi thế chuyên môn của mình.” Ông cho rằng, bất kể các nhà cung cấp đám mây khác có theo kịp hay không, cảnh quan cạnh tranh sẽ tiến hóa từ cạnh tranh đơn lẻ sang phân hóa vị trí sinh thái.

Áp lực “đường ống hóa” của các công ty mô hình lớn có đang gia tăng?

“Phân tuyến hóa” không có nghĩa là các công ty mô hình biến mất, mà là họ mất đi lợi thế sản phẩm, quyền kết nối người dùng và quyền phát ngôn, lợi nhuận chuyển sang các nền tảng tính toán, khiến họ trở thành vai trò “bị chi phối”.

Dưới làn sóng tích hợp của các nhà cung cấp đám mây, “tính chất đường ống” đang trở thành thanh gươm Damocles treo trên đầu các công ty mô hình lớn độc lập. Trong cuộc đấu tranh âm thầm này, các nhà lãnh đạo như Zhipu AI, Moonshot AI (Kimi), MiniMax đã không chọn sự nhượng bộ thụ động, mà phát triển từ chính bản chất của mình, vạch ra những con đường đột phá khác nhau.

Trong cuộc đối thoại công khai vào ngày 8 tháng 4, CEO của Zhipu AI, Trương Bằng, đã rõ ràng tuyên bố rằng mục tiêu cuối cùng của Zhipu chưa bao giờ là trở thành một “công cụ gọi mở có thể thay thế tùy ý”, mà là xây dựng các tác nhân tự trị toàn diện (Autonomous Agent). Định vị này nhằm giúp Zhipu nâng cấp từ “nhà cung cấp mô hình” thành “người thực hiện nhiệm vụ”, từ đó tránh được bẫy giá thấp của các đường ống API thuần túy.

Mặt tối của Mặt Trăng (Kimi) áp dụng chiến lược “phân tán bố trí + chuyên sâu vào văn bản dài”. Đồng thời tích hợp với nhiều nền tảng đám mây chính流 như Volcano Engine và Alibaba Cloud, đảm bảo nguồn cung năng lực tính toán đa dạng, không phụ thuộc vào một kênh duy nhất, từ đó bảo đảm tính ổn định của dịch vụ và kiểm soát chi phí. Kimi K2.6 ra mắt vào tháng 4 năm 2026 sử dụng kiến trúc Mixed Experts (MoE), với cửa sổ ngữ cảnh tiêu chuẩn đạt 256K tokens.

MiniMax đang tập trung nguồn lực cốt lõi vào các lĩnh vực chuyên sâu như sáng tạo nội dung, dịch vụ khách hàng thông minh, giáo dục, dịch vụ doanh nghiệp và giải trí xã hội, đặc biệt chú trọng triển khai tại các bối cảnh như AI trò chơi, người số hóa và tương tác đa mô态, nhằm xây dựng “khả năng tùy chỉnh không thể thay thế bởi nền tảng đám mây”.

Kimi

Việc tích hợp nền tảng từ các công ty lớn có làm tăng tốc quá trình “hóa ống dẫn” của các công ty mô hình không? Chuyên gia phân tích phân bổ tài sản hàng đầu của Công ty Chứng khoán Quốc Tín, Vương Khai, cho rằng cần phân biệt giữa góc nhìn ngắn hạn và dài hạn.

Anh ấy cho rằng: “Trong ngắn hạn, các kênh phân phối bị nền tảng kiểm soát, quyền định giá một phần được nhượng lại, lợi nhuận của các nhà phát triển mô hình chuyển dịch về phía các điểm vào là quy luật kinh doanh. Nhưng về dài hạn, các mô hình tổng quát dễ trở nên đồng nhất, còn các mô hình học sâu cho các lĩnh vực chuyên biệt như tài chính, y tế, pháp lý thì rào cản chuyên môn không thể xóa bỏ chỉ bằng cách tập trung và tích hợp.”

Để đối phó với rủi ro bị nền tảng hóa, có thể tham khảo chiến lược của OpenAI và Anthropic: một mặt, tăng cường các kênh tiếp cận người dùng cuối trực tiếp, ví dụ như bản chất vận hành độc lập của ChatGPT và Claude nhằm xây dựng kết nối người dùng vượt qua nền tảng; mặt khác, tốc độ cải tiến công nghệ và nhận thức thương hiệu của người dùng là hai hàng rào bảo vệ hiệu quả, do đó các công ty mô hình cần cân bằng giữa đầu tư nghiên cứu và bố trí chiến lược sản phẩm.

Cuộc博弈 “tubular hóa và nền tảng hóa” này có thể không phải là ai nuốt chửng ai, mà là sự phân công ngày càng rõ ràng hơn: các nhà cung cấp đám mây đảm nhận vai trò đường ống, các công ty mô hình tập trung vào công nghệ, và cả hai bên dần xác định ranh giới sinh tồn của riêng mình trong quá trình cạnh tranh.

Về việc ai sẽ ăn ai, ở giai đoạn hiện tại, câu chuyện vẫn chưa đến hồi kết.

Bài viết này đến từ tài khoản chính thức WeChat “Báo cáo Khoa học và Công nghệ Sáng tạo”, tác giả: Vương Nại