Một công ty AI mới có tên @subquadratic vừa ra mắt một mô hì

Một công ty AI mới có tên @subquadratic vừa ra mắt một mô hình phá vỡ một trong những giới hạn lâu đời nhất trong AI hiện đại. Để hiểu tại sao điều này quan trọng, bạn cần hiểu một bài toán toán học đơn giản đã âm thầm định hình mọi chatbot bạn từng sử dụng. - ➠ Vấn đề: AI Đọc theo Cặp, và Cặp Không Tăng Cường Mỗi LLM hiện đại (ChatGPT, Claude, Gemini) đều đọc văn bản bằng cách kiểm tra mối quan hệ giữa mỗi từ với mọi từ còn lại. Nghe có vẻ ổn cho đến khi bạn tính toán: ▸ 10 từ → 100 phép so sánh ▸ 1.000 từ → 1 triệu phép so sánh ▸ 1 triệu từ → 1 nghìn tỷ phép so sánh Việc gấp đôi đầu vào không gấp đôi khối lượng công việc. Nó tăng lên bốn lần. Đây được gọi là sự tăng trưởng bậc hai, và đã được tích hợp vào AI từ năm 2017. Điều đó có nghĩa gì với bạn: ▸ Tài liệu dài trở nên đắt đỏ nhanh chóng ▸ Các mô hình thường bỏ sót các sự thật ẩn sâu trong đầu vào dài ▸ Toàn bộ mã nguồn hoặc thư viện nghiên cứu không vừa vào Bây giờ bạn đã biết lý do: càng dài ngữ cảnh, mô hình LLM của bạn càng trở nên kém thông minh và đắt đỏ hơn. - ➠ Cách AI Hiện Đại Che Giấu Vấn Đề Ngành công nghiệp đã xây dựng các giải pháp thay thế thay vì sửa đổi toán học: ▸ RAG: một công cụ tìm kiếm trích xuất vài đoạn văn bản liên quan, chỉ truyền những đoạn đó cho mô hình ▸ Chunking: tài liệu dài được chia thành các phần nhỏ ▸ Hệ thống Agent: nhiều lần gọi AI xử lý các phần khác nhau, được kết nối bằng mã ▸ FlashAttention: các thủ thuật bộ nhớ thông minh giúp thực hiện cùng một phép toán đắt đỏ nhanh hơn Những giải pháp này hoạt động, nhưng không cái nào khắc phục được vấn đề thực sự. Toàn bộ hệ sinh thái AI hiện đại (cơ sở dữ liệu vector, pipeline truy xuất, kỹ thuật prompt) tồn tại vì các mô hình không thể giữ toàn bộ nội dung trong tầm nhìn. — ➠ SubQ Làm Khác Biệt Như Thế Nào SubQ sử dụng một cách tiếp cận mới gọi là SSA (Subquadratic Sparse Attention). Ý tưởng trong một câu: thay vì so sánh từng từ với mọi từ còn lại, mô hình xác định những từ nào thực sự quan trọng đối với câu hỏi và bỏ qua phần còn lại. Điều này thay đổi sự tăng trưởng từ bậc hai thành tuyến tính. Gấp đôi đầu vào giờ đây chỉ gấp đôi khối lượng công việc thay vì tăng bốn lần. Phần khó không phải là ý tưởng — vì nhiều người đã từng thử trước đây. Mỗi nỗ lực trước đó đều đánh đổi một thứ gì đó: ли độ chính xác, khả năng tìm kiếm sự thật ẩn sâu trong văn bản, hoặc hiệu quả. Subquadratic, đồng sáng lập bởi @alex_whedon, tuyên bố họ đã giải quyết đồng thời cả ba vấn đề này. — ➠ Bằng Chứng Các bài kiểm tra được xác minh bởi bên thứ ba: ▸ Đẳng cấp với Claude Opus 4.6 trên RULER 128K (bài kiểm tra suy luận ngữ cảnh dài) ▸ Vượt qua Opus 4.7, GPT 5.4 và Gemini 3.1 Pro trên MRCR v2 (truy xuất đa chứng cứ), nhưng thua Opus 4.6 và GPT 5.5 ▸ Vượt qua Opus 4.6 và Gemini 3.1 Pro trên SWE-Bench (nhiệm vụ lập trình thực tế), nhưng kém hơn Opus 4.7 ▸ Nhanh hơn 52 lần so với FlashAttention ở 1 triệu token ▸ Một phiên bản nghiên cứu xử lý 12 triệu token với ít hơn khoảng 1.000 lần phép tính chú ý so với các mô hình tiên tiến khác Tóm lại, đây không phải là “mô hình tốt nhất thế giới”. Đây là độ chính xác cấp tiên tiến với chi phí cơ bản thấp hơn nhiều. — ➠ Sam Altman Liên Quan Như Thế Nào Hai tuyên bố lớn nhất của Altman đều hướng đến cùng một vấn đề mà SubQ đang giải quyết. Về chi phí: Trong bài đăng blog tháng 2/2025 “Three Observations”, Altman viết rằng chi phí sử dụng AI giảm khoảng 10 lần mỗi 12 tháng. Ông gọi đây là “mạnh mẽ hơn đáng kể” so với Định luật Moore. Luận điểm của ông: suy luận rẻ hơn là lực lượng chủ đạo định hình khả năng của AI. Về quy mô: Trở lại năm 2023, Altman từng nói rằng thời đại các mô hình ngày càng lớn đang kết thúc, và cuộc cạnh tranh thực sự nằm ở khả năng trên mỗi đồng chi phí. Ông so sánh cuộc đua số lượng tham số với cuộc đua GHz trong chip những năm 1990 — sai trục. SubQ lấy cả hai giả định này làm chân lý. Slogan của họ là “Hiệu quả là trí tuệ”. Nhưng điểm mấu chốt: Con đường mà Altman nêu ra để giảm chi phí AI là tiến bộ phần cứng, tối ưu hóa phần mềm và tinh giản mô hình. Ông chưa từng công khai ủng hộ việc thiết kế lại toán học chú ý. Vì vậy, thông điệp của SubQ phù hợp với kinh tế học của ông, nhưng đồng thời cũng là một cuộc đặt cược rằng các phòng thí nghiệm lớn đã bỏ lỡ một cơ hội kiến trúc quan trọng. — ➠ Vì Sao Điều Này Quan Trọng Nếu SubQ triển khai thành công ở quy mô sản xuất: ▸ Toàn bộ mã nguồn trở thành một cuộc hội thoại duy nhất. Không còn cần hệ thống đa agent xử lý file. Mô hình giữ nguyên toàn bộ kho mã. ▸ RAG trở nên không cần thiết. Nhiều hạ tầng AI ngày nay tồn tại để bù đắp cho giới hạn bậc hai. Loại bỏ giới hạn đó, và toàn bộ hệ thống hỗ trợ trở thành gánh nặng. ▸ Các agent chạy dài không còn là giải pháp tạm thời. Các phiên làm việc kéo dài nhiều ngày với bộ nhớ bền vững trở thành tính năng gốc. ▸ Các ứng dụng mới trở nên khả thi. Các tác vụ trước đây quá đắt đỏ (xem xét toàn bộ tài liệu, tìm kiếm mã chi tiết, quét tuân thủ) trở nên phổ biến. — ➠ Những Lưu Ý Thành Thực ▸ Hiện đang trong giai đoạn beta riêng tư. Độ tin cậy thực tế chưa được kiểm tra kỹ lưỡng. Vì vậy, cho đến khi có thêm dữ liệu, hãy coi thông báo này như một lời giới thiệu — nhiều người nghi ngờ đây chỉ là hành động mang tính biểu tượng. ▸ Điểm MRCR v2 (65,9%) là tốt nhưng vẫn kém Opus 4.6 (78,3%) và GPT 5.5 (74%). SSA hiệu quả hơn, nhưng không nhất thiết mạnh mẽ hơn về khả năng. ▸ Các bài kiểm tra được công bố bởi chính nhóm phát triển với xác minh bên thứ ba. Sự tái tạo học thuật mới là bài kiểm tra thực sự. ▸ Kết quả 12 triệu token là mô hình nghiên cứu, không phải sản phẩm chính thức (sản phẩm chính thức là 1 triệu token). — ➠ Kết Luận Trong chín năm qua, mọi AI dựa trên transformer đều phải trả cùng một “thuế bậc hai”. Subquadratic tuyên bố họ cuối cùng đã tìm ra cách tránh nó. Các bài kiểm tra cho thấy họ ít nhất đang đi đúng hướng. Altman đã nói với ngành công nghiệp trong ba năm qua rằng khả năng trên mỗi đồng chi phí là chiến trường mới. SubQ là một trong những công ty đầu tiên cố gắng giành chiến thắng trong cuộc chiến này bằng cách thay đổi toán học nền tảng thay vì chồng chất các giải pháp tạm thời. Liệu họ có thành công hay không giờ đây là một câu hỏi thực nghiệm công khai.