Cuộc chiến mã hóa AI vừa có thêm một người dẫn đầu về giá. Kimi 2.7 của Moonshot AI, còn được gọi là K2.7 Code, đang định vị mình là lựa chọn tiết kiệm chi phí thay thế cho Claude Fable 5 của Anthropic, một trong những mô hình mã hóa mạnh mẽ nhất trên thị trường. Thông điệp rất đơn giản: đạt hiệu suất gần như tương đương với chi phí chỉ bằng một phần nhỏ.
Giá API của Kimi 2.7 là 0,95 USD mỗi triệu token đầu vào và 4,00 USD mỗi triệu token đầu ra, với các lần trùng lặp bộ nhớ đệm chỉ mất 0,19 USD mỗi triệu token.
Kimi 2.7 mang đến những gì
Về mặt nội bộ, Kimi 2.7 hoạt động trên kiến trúc Mixture-of-Experts. Mô hình này có tổng cộng lên đến một nghìn tỷ tham số, nhưng chỉ có 32 tỷ tham số được kích hoạt tại bất kỳ thời điểm nào. Thiết kế này giúp nó đạt hiệu suất vượt trội trong khi vẫn duy trì chi phí tính toán ở mức hợp lý.
Điểm bán hàng chính của mô hình là độ tin cậy khi xử lý ngữ cảnh dài và tỷ lệ thành công nhiệm vụ cao hơn. Đối với các nhà phát triển đang giải quyết các vấn đề kỹ thuật phần mềm thực tế, nơi các tệp dài và các phụ thuộc phức tạp, độ tin cậy này quan trọng hơn các điểm số benchmark trên các bài toán đơn giản.
Moonshot AI, phòng thí nghiệm có trụ sở tại Bắc Kinh đứng sau chuỗi mô hình K2, đang không ngừng vươn lên trong cuộc đua các mô hình tiên tiến. Kimi 2.7 là bước đi đầy tham vọng nhất của họ vào lĩnh vực AI chuyên về mã hóa, một lĩnh vực ngày càng bị chi phối bởi các phòng thí nghiệm phương Tây như Anthropic, OpenAI và Google DeepMind.
Mô hình mà nó đang theo đuổi
Claude Fable 5, được phát hành vào ngày 9 tháng 6 năm 2026, đã đặt ra một tiêu chuẩn cao. Mô hình mới nhất của Anthropic đã vượt qua ngưỡng 90% trên các tiêu chí phân tích cốt lõi, một cột mốc đại diện cho bước nhảy vọt đáng kể trong hiệu suất kỹ thuật phần mềm và các nhiệm vụ phân tích.
Moonshot AI tin rằng phần lớn các nhà phát triển không cần mô hình tốt nhất tuyệt đối. Nếu Kimi 2.7 có thể cung cấp khả năng lập trình cạnh tranh với mức giá không yêu cầu cuộc họp xem xét ngân sách mỗi quý, thì con số này bắt đầu trở nên rất hấp dẫn đối với các startup, nhà phát triển độc lập và các đội ngũ kỹ thuật quy mô vừa.
Bức tranh tổng thể về cuộc cạnh tranh trong lĩnh vực AI
Quy mô hàng nghìn tỷ tham số của kiến trúc đầy đủ Kimi 2.7 đặt nó vào cùng phân khúc với các mô hình lớn nhất từ bất kỳ phòng thí nghiệm nào trên toàn cầu. Phương pháp Mixture-of-Experts, chỉ kích hoạt 32 tỷ tham số mỗi truy vấn, là yếu tố giúp việc cung cấp với mức giá đầu vào dưới một đô la trở nên khả thi về mặt kinh tế.
Claude Fable 5 vẫn là tiêu chuẩn cho hiệu suất mã hóa thuần túy, đặc biệt trong các nhiệm vụ phân tích phức tạp khi điểm số trên 90% của nó tự nói lên tất cả. Tuy nhiên, Kimi 2.7 là một lựa chọn thay thế khả thi cho các đội có ngân sách token hạn chế và khối lượng công việc cao.
Mức giá truy cập bộ nhớ đệm ở mức 0,19 USD mỗi triệu token đặc biệt đáng chú ý cho các ứng dụng sản xuất. Các nhà phát triển sắp xếp quy trình làm việc để tối đa hóa việc tái sử dụng bộ nhớ đệm có thể thấy chi phí hiệu quả giảm mạnh, giúp Kimi 2.7 trở thành một trong những mô hình mã hóa cấp cao rẻ nhất hiện có cho các tác vụ lặp lại hoặc theo mẫu.
