Composer 2 của Cursor sử dụng mô hình Kimi K2.5 từ Moonshot AI

Tác giả: XinGPT

Trợ lý lập trình AI của bạn, có thể dựa trên một mô hình Trung Quốc mà bạn chưa từng nghe đến

Từ DistillAI, một nền tảng truyền thông tài chính thời đại AI.

Lưu ý: Chúng tôi đang thử nghiệm cách làm nội dung hoàn toàn bằng AI, do đó bài viết này từ chủ đề đến nội dung đều do Claude AI tạo ra.

Bạn mở Cursor mỗi ngày, viết mã, tái cấu trúc hàm và nhờ AI giúp bạn gỡ lỗi. Bạn cảm thấy mình đang sử dụng công nghệ tiên tiến nhất của Thung lũng Silicon, bởi đây là một công ty nổi bật với định giá 29,3 tỷ USD, danh sách nhà đầu tư bao gồm Thrive Capital và a16z, với người dùng trải rộng khắp cộng đồng nhà phát triển toàn cầu.

Cho đến tuần trước, một người đã nhìn thấy một ID mô hình trong kết quả trả về của API Composer 2: kimi-k2p5-rl-0317-s515-fast.

Kimi K2.5 — Mô hình mã nguồn mở đến từ công ty Trung Quốc Moonshot AI.

Bộ não của agent mã hóa của bạn, không phải cái mà bạn tưởng.

Composer 2: Một đợt ra mắt được đóng gói cẩn thận

Vào ngày 20 tháng 3, Cursor đã ra mắt mô hình mã hóa thế hệ mới Composer 2, với một cụm từ đầy trọng lượng trên blog chính thức: «frontier-level coding intelligence» — trí thông minh lập trình cấp前沿.

Thông báo không đề cập đến bất kỳ tên mô hình nền tảng nào. Không có Kimi, không có Moonshot, không có “Trung Quốc”, không có “mã nguồn mở”. Mọi thứ trông giống như thành quả tự phát triển của Cursor.

Nhưng cộng đồng kỹ thuật rất nhạy bén. Ngay trong ngày phát hành, các nhà phát triển đã nhận thấy đường dẫn mô hình được trả về khi gọi API của Composer 2: accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast. Chuỗi ký tự này gần như là lời tự giới thiệu — Kimi K2.5, kèm theo tinh chỉnh RL (học tăng cường).

Tin tức lan truyền nhanh chóng trên mạng xã hội. Hai ngày sau, Lee Robinson, Phó chủ tịch giáo dục phát triển của Cursor, đã phản hồi công khai, thừa nhận rằng Composer 2 thực sự dựa trên nền tảng Kimi K2.5, nhưng nhấn mạnh rằng “chỉ khoảng một phần tư tổng sức tính toán đến từ nền tảng Kimi, phần còn lại đến từ việc huấn luyện riêng của Cursor”. Anh ấy gọi việc không đề cập đến Kimi trong bài blog là “một sai sót”.

Nếu đây là lần đầu tiên Cursor “sai lầm”, có thể vẫn có thể coi đó là sự sơ suất. Nhưng không phải vậy.

Khi Composer 1 được phát hành năm ngoái, cũng có người phát hiện nó sử dụng tokenizer của DeepSeek, nhưng không hề công bố trên bất kỳ kênh chính thức nào. Một lần có thể là sơ suất, nhưng hai lần thì khó mà không khiến người ta nghi ngờ: đây là do quên nói, hay là không muốn nói?

Lựa chọn lý trí, logic im lặng

Trước khi chỉ trích Cursor, tôi cảm thấy cần phải hiểu một thực tế: việc sử dụng Kimi K2.5 làm nền tảng, về mặt kỹ thuật và thương mại, là một quyết định rất hợp lý.

Kimi K2.5 là mô hình mã nguồn mở do Yue Zhi An Mian phát hành vào tháng 1 năm nay, sử dụng kiến trúc MoE (hỗn hợp chuyên gia), có hiệu suất rất ấn tượng trong các nhiệm vụ tạo mã. Quan trọng hơn, nó là mã nguồn mở — nghĩa là chi phí tiếp cận cực kỳ thấp. Đối với một công ty như Cursor, cần lặp nhanh và tập trung vào lớp sản phẩm và tích hợp công cụ, việc sử dụng một mô hình mã nguồn mở chất lượng cao sẵn có làm nền tảng, sau đó tinh chỉnh bằng dữ liệu và học tăng cường của riêng mình là con đường hiệu quả nhất.

Đây thực ra không phải điều gì mới mẻ.

Thị trường sản phẩm AI hôm nay, việc sử dụng các mô hình mã nguồn mở của Trung Quốc làm nền tảng phổ biến hơn nhiều so với hầu hết mọi người tưởng tượng. DeepSeek, Tongyi Qianwen, Kimi — những mô hình do các đội ngũ Trung Quốc phát hành mã nguồn mở đang trở thành nền tảng vô hình cho hệ sinh thái AI toàn cầu. Chỉ là không ai muốn chủ động đề cập đến điều này.

Lý do không phức tạp. Trong bối cảnh kể chuyện về cạnh tranh công nghệ Trung-Mỹ, câu nói “Sản phẩm AI của chúng tôi sử dụng mô hình Trung Quốc làm nền tảng” đối với một công ty Mỹ không chỉ là việc tiết lộ một chi tiết kỹ thuật, mà còn là một lỗ hổng rủi ro truyền thông. Nhà đầu tư sẽ nghĩ gì? Khách hàng doanh nghiệp có lo ngại về an toàn dữ liệu không? Truyền thông sẽ viết tiêu đề như thế nào?

Vì vậy, sự im lặng trở thành sự đồng thuận trong ngành. Mọi người đều sử dụng, nhưng không ai nói ra.

Nhưng sự im lặng là có chi phí.

Authorization and Compliance: The Small Print You Ignored

Giao thức nguồn mở của Kimi K2.5 là bản sửa đổi của giấy phép MIT, phần lớn các điều khoản rất linh hoạt, nhưng có một ràng buộc quan trọng: nếu sản phẩm thương mại có hơn 100 triệu người dùng hoạt động hàng tháng hoặc doanh thu hàng tháng vượt quá 20 triệu USD, phải ghi chú rõ ràng “Kimi K2.5” trên giao diện người dùng.

Doanh thu hàng năm của Cursor vào khoảng 2 tỷ USD, doanh thu hàng tháng khoảng gấp 8 lần ngưỡng này.

This authorization requirement is clear, enforceable, and clearly ignored.

Tôi không phải là chuyên gia pháp lý và không bàn đến những hậu quả pháp lý cụ thể ở đây. Tuy nhiên, cần lưu ý rằng ngành phần mềm đã mất hai thập kỷ để xây dựng sự tôn trọng đối với các giao thức mã nguồn mở — từ những vụ kiện GPL đầu tiên đến việc SBOM (danh sách vật liệu phần mềm) trở thành tiêu chuẩn trong an ninh chuỗi cung ứng. Việc tuân thủ giấy phép cho các mô hình AI hiện nay có lẽ mới chỉ ở giai đoạn đầu của thời kỳ hoang dã đó.

Nhiều người có thể cho rằng việc ghi chú “Kimi K2.5” không có gì đáng kể. Nhưng vấn đề nằm ở chỗ, nếu ngay cả yêu cầu tuân thủ đơn giản như vậy cũng có thể bị bỏ qua, thì những vấn đề phức tạp hơn — dòng chảy dữ liệu, khả năng kiểm toán hành vi mô hình, tuân thủ xuyên biên giới — còn ai đang nghiêm túc quan tâm?

Thuế tín nhiệm: Chi phí ẩn không minh bạch

Một số người dùng thuật ngữ “Trust Tax” (thuế niềm tin) để mô tả chi phí của sự kiện này do Cursor gây ra, và tôi cảm thấy khái niệm này rất chính xác.

Khi người dùng phát hiện ra rằng họ đang trả 20 USD mỗi tháng cho dịch vụ “Trí tuệ lập trình tiên tiến” mà thực chất chỉ là một mô hình mã nguồn mở miễn phí kèm theo tinh chỉnh, niềm tin sẽ bị rạn nứt. Vấn đề không nằm ở chỗ Kimi K2.5 không đủ tốt — nó thực sự rất tốt — mà nằm ở việc người dùng cảm thấy mình bị che giấu thông tin.

Đây không phải là lần đầu tiên Cursor đối mặt với khủng hoảng niềm tin. Trước đó, tranh cãi về giá của gói Pro “không giới hạn” khiến người dùng phát hiện đã dùng hết toàn bộ hạn mức một tháng chỉ sau 3 ngày.再加上现在的模型来源问题，信任债务在累积。

Vấn đề sâu hơn là: Trong danh mục công cụ AI agent, người dùng thực sự trả tiền vì điều gì?

Nếu câu trả lời là “khả năng mô hình”, thì người dùng hoàn toàn có thể gọi trực tiếp API của Kimi K2.5, chi phí thấp hơn nhiều. Nếu câu trả lời là “trải nghiệm sản phẩm và tích hợp chuỗi công cụ”, thì Cursor nên nói rõ ràng giá trị thực sự của mình nằm ở cấp độ nào, thay vì mơ hồ ám chỉ mọi thứ đều là tự phát triển.

Ngành công nghiệp điện thoại di động đã giải quyết vấn đề này từ lâu. Không ai cảm thấy bị lừa đảo vì iPhone sử dụng chip do TSMC sản xuất, vì Apple chưa bao giờ giả vờ rằng mình có nhà máy bán dẫn. Minh bạch và giá trị thương mại không mâu thuẫn với nhau.

Thời đại của "nền tảng ẩn" do Trung Quốc mã nguồn mở

Bên ngoài trường hợp riêng của Cursor, xu hướng cấu trúc đáng chú ý hơn là các mô hình mã nguồn mở của Trung Quốc đang trở thành hạ tầng nền tảng cho các ứng dụng AI toàn cầu.

CEO của Hugging Face, Clément Delangue, khi bình luận về sự việc này, cho biết rằng nguồn mở Trung Quốc là “lực lượng lớn nhất định hình hạ tầng AI toàn cầu”. Đây không phải là lời nói khách sáo.

Giá trị của Mặt tối của Mặt trăng đã tăng gấp bốn lần trong ba tháng, đạt khoảng 18 tỷ USD. Sự kiện Cursor, theo một nghĩa nào đó, đã thay Kimi thực hiện một sự bảo chứng năng lực dành cho các nhà phát triển toàn cầu — công cụ lập trình AI có giá trị cao nhất thế giới đã chọn mô hình của bạn làm nền tảng, điều này còn thuyết phục hơn bất kỳ benchmark nào.

Xu hướng này không chỉ mang lại những cuộc thảo luận trên cấp độ địa chính trị. Đối với người dùng doanh nghiệp, có một vấn đề thực tế: mã của bạn đang được xử lý bởi các mô hình có nguồn gốc mà bạn không biết.

Trong các ngành được quản lý (tài chính, y tế, chính phủ), chủ quyền dữ liệu và tuân thủ xuyên biên giới là yêu cầu bắt buộc. Nếu đội ngũ phát triển của bạn đang sử dụng một công cụ AI mà nguồn gốc mô hình của nó không minh bạch, nhóm tuân thủ của bạn có thể hoàn toàn không biết mình đang đối mặt với rủi ro gì. Đây không phải là kịch bản giả định, đây là điều đang xảy ra thực tế.

Một số người gọi rủi ro này là “Shadow AI”, tương tự khái niệm Shadow IT trước đây. Các nhà phát triển đã tích hợp các mô hình AI vào IDE và dòng chảy CI/CD, nhưng các nhóm an toàn và pháp lý lại hoàn toàn không hay biết.

Bước tiếp theo: AI-BOM và tính minh bạch của chuỗi cung ứng

Sau các sự kiện an ninh chuỗi cung ứng như Log4j, ngành công nghiệp phần mềm đã dần chấp nhận khái niệm SBOM (Software Bill of Materials) — danh sách rõ ràng cho biết phần mềm của bạn sử dụng những thành phần nào, phiên bản nào, và có lỗ hổng nào đã được biết đến không.

Các mô hình AI cũng cần những thứ tương tự.

Khái niệm AI-BOM (AI Bill of Materials) đã bắt đầu được thảo luận trong cộng đồng bảo mật. Danh sách vật liệu của một sản phẩm AI nên bao gồm: mô hình nền là gì, nguồn gốc và cách xử lý dữ liệu huấn luyện, phương pháp tinh chỉnh, cũng như cách triển khai mô hình và luồng dữ liệu.

Đối với các nhà phát triển, điều này có nghĩa là khi chọn công cụ AI, họ cần bắt đầu xem xét nguồn gốc của mô hình giống như cách kiểm tra giấy phép của các thư viện phụ thuộc. `npm audit` và `pip check` đã là thao tác hàng ngày, và trong tương lai, `model audit` có thể cũng sẽ trở thành tiêu chuẩn.

Đối với các nhà sản xuất công cụ AI, việc chủ động tiết lộ nguồn gốc mô hình không phải là thể hiện sự yếu thế, mà là đầu tư vào việc xây dựng niềm tin lâu dài. Công ty đầu tiên biến AI-BOM thành cấu hình tiêu chuẩn có thể giành được mức giá ưu đãi từ niềm tin thị trường.

Đối với toàn bộ ngành, sự minh bạch trong chuỗi cung ứng mô hình đang từ “nên có” trở thành “phải có”. Sự thay đổi này có thể không cần một sự kiện cấp độ Log4j để thúc đẩy như an toàn chuỗi cung ứng phần mềm — câu chuyện của Cursor đã là một tiếng chuông cảnh tỉnh đủ lớn.

Quay lại cảnh ban đầu. Cursor của bạn vẫn hoạt động tốt, Kimi K2.5 vẫn là một mô hình xuất sắc. Sức mạnh kỹ thuật của Moonshot đáng được tôn trọng, và sự tích lũy của Cursor ở cấp độ sản phẩm và chuỗi công cụ cũng là có thật.

Vấn đề không nằm ở việc “sử dụng mô hình Trung Quốc” — trong một hệ sinh thái mã nguồn mở toàn cầu, công nghệ tốt không nên có nhãn hiệu quốc gia. Vấn đề nằm ở việc “không thông báo cho bạn”.

Trong bối cảnh các tác nhân AI ngày càng thâm nhập sâu vào quy trình làm việc, chúng ta đang giao ngày càng nhiều mã, dữ liệu và quyết định cho những công cụ này. Chúng ta ít nhất nên biết, người đứng sau “bộ não” của công cụ đó là ai.

Transparency is not a technical detail; it is the infrastructure of trust.