Boris Cherny cho biết, đây là bước nhảy vọt về năng lực lớn nhất kể từ Opus 4.5 vào tháng 11 năm 2025, mô hình bắt đầu có "hương vị của mô hình lớn".

Tác giả bài viết, nguồn: 0x9999in1, ME News

Tóm tắt ngắn

Anthropic chính thức ra mắt Claude Fable 5, mô hình Mythos đầu tiên được mở rộng cho công chúng; giá 10/50 USD mỗi triệu token, giảm hơn một nửa so với bản thử nghiệm.
Đánh giá độ khó FrontierCode Diamond, Fable 5 đạt 29,3%, GPT-5.5 chỉ có 5,7%, Opus 4.8 cũng chỉ đạt 13,4%.
Stripe đã di chuyển 50 triệu dòng mã Ruby trong một ngày — trước đây cần một đội ngũ làm hai tháng.
Giao diện thị giác có thể chụp màn hình để vượt qua Pokémon FireRed, tái tạo mã nguồn trang web; giao diện sinh học dự đoán việc lắp ráp vỏ virus adenovirus vượt trội hơn mô hình protein chuyên dụng; sinh học tế bào đơn đạt hiệu suất vượt mô hình dùng trong bài báo Science, trong khi tham số chỉ bằng một phần trăm.
An toàn đi theo "hai hướng": Phiên bản công chúng Fable 5 áp đặt giới hạn cứng, phiên bản tổ chức Mythos 5 được mở cửa có chọn lọc cho khoảng 200 tổ chức thông qua chương trình Glasswing.
Boris Cherny cho biết, đây là bước nhảy vọt về năng lực lớn nhất kể từ Opus 4.5 vào tháng 11 năm 2025, mô hình bắt đầu có "hương vị của mô hình lớn".

Một, Anthropic biến buổi phát hành thành quầy phân loại

Trước tiên, hãy nêu kết luận. Fable 5 không phải là một lần cập nhật phiên bản thông thường. Đó là lần đầu tiên Anthropic phân biệt rõ ràng ai có thể sử dụng, sử dụng đến mức nào, và trả bao nhiêu tiền.

Công chúng nhận được Fable 5. Có hàng rào bảo vệ, cấm sử dụng cho mục đích an ninh mạng và các thao tác rủi ro cao.

Các tổ chức nhận được Mythos 5. Cùng kiến trúc, ít hạn chế hơn, tham gia kế hoạch Glasswing, hiện chỉ bao gồm khoảng 200 tổ chức, bao gồm chính phủ Mỹ.

Giá thế nào? Cả hai đều giống nhau: 10 USD cho mỗi triệu token đầu vào, 50 USD cho mỗi triệu token đầu ra. Giảm hơn một nửa so với giai đoạn thử nghiệm.

Đây là thao tác gì? Đây là việc biến "an toàn" thành một phần của sản phẩm, chứ không chỉ là một câu khẩu hiệu PR tại sự kiện ra mắt.

Trước đây, khi theo dõi các mô hình lớn được ra mắt, chúng ta đã quen với một cách kể chuyện: “Chúng tôi mạnh nhất, rẻ nhất, an toàn nhất.” Ba câu này được hô cùng lúc. Hôm nay Anthropic đã tách rời chúng: khả năng mạnh nhất được đặt trong kênh kiểm soát, phiên bản công chúng hy sinh một phần tự do để đổi lấy rào cản thấp hơn.

Điều này có lý do rõ ràng. Trước đây, Mythos đã được Anthropic sử dụng nội bộ để phát hiện "hàng ngàn lỗ hổng phần mềm". Khả năng này khi được phân phối, có nghĩa là gì? Nghĩa là cùng một mô hình có thể vừa vá lỗ hổng, vừa khai thác lỗ hổng. Anthropic không giả vờ không biết. Họ đã chọn một con đường khó khăn hơn, nhưng dễ giải thích hơn: mở rộng theo cấp độ.

Nghe có vẻ giống với logic phân phối vaccine phải không? Đúng vậy. Tiêm trước cho nhóm nguy cơ cao, sau đó mới phổ biến rộng rãi. Sự khác biệt chỉ là lần này, "nguy cơ cao" tương ứng với năng lực cao.

Hai, 29,3% so với 5,7%: Đây không phải là dẫn đầu, đây là sự cách mạng

Độ khó Diamond của FrontierCode là một trong những tiêu chuẩn đánh giá mã được công nhận cao nhất hiện nay.

Fable 5: 29,3%.

GPT-5.5: 5,7%.

Claude Opus 4.8: 13,4%.

29,3% so với 5,7%. Chênh lệch vượt quá 5 lần.

Sự chênh lệch này không phổ biến trong lịch sử các mô hình lớn. Bình thường trong hai năm qua là gì? Là trên bảng xếp hạng, các bên cạnh tranh khốc liệt, chỉ chênh lệch vài phần trăm đã phải đăng tweet ăn mừng. Là OpenAI, Anthropic và Google đang so sánh chiều cao ở các chữ số sau dấu phẩy.

Bây giờ khác rồi. Fable 5 đã vượt xa GPT-5.5 không chỉ một hai bước, mà là cả một quãng đường.

Of course, a single ranking cannot tell the whole story. So let's look at real-world scenarios.

Stripe đã làm gì với nó? Di chuyển 50 triệu dòng mã Ruby trong một ngày.

50 triệu dòng là khái niệm như thế nào? Toàn bộ hệ thống giao dịch cốt lõi của một công ty internet lớn cũng chỉ ở mức này. Với khối lượng công việc tương tự, trước đây cấu hình thông thường là — một đội nhóm làm trong hai tháng.

Một ngày so với hai tháng. Giảm chi phí nhân công xuống mức gần như giảm một cấp độ.

Điều này có nghĩa gì? Điều này có nghĩa là việc di chuyển mã đang chuyển từ "vấn đề kỹ thuật" thành "vấn đề sức mạnh tính toán".

Kỹ sư sẽ không mất việc. Nhưng giá trị biên của kỹ sư đang được định giá lại.

Ba、việc chụp màn hình mô hình Pokémon để vượt qua có nghĩa là gì

Anthropic đã thêm một chi tiết hơi "tinh nghịch" trong bản demo—Fable 5 có thể vượt qua Pokémon FireRed chỉ bằng cách chụp màn hình.

Nghe giống đồ chơi à?

Không.

Để hoàn thành một trò chơi RPG, bạn cần gì? Đó là lập kế hoạch dài hạn, ghi nhớ trạng thái, hiểu biết thị giác, nhận thức bản đồ, suy luận đối thoại và phân tách mục tiêu. Bộ kỹ năng này khi kết hợp lại chính là bản mẫu của Agent.

Ứng dụng thực tế hơn là nó có thể tái tạo mã nguồn trang web chỉ dựa trên ảnh chụp màn hình. Điều này có nghĩa là chi phí "kỹ thuật nghịch đảo" trong phát triển giao diện người dùng đã được giảm xuống mức mà một nhà thiết kế bình thường cũng có thể thực hiện được.

Đi sâu hơn vào phía sinh học, chuyện còn nghiêm trọng hơn.

Fable 5 có thể dự đoán việc lắp ráp vỏ virus adeno của Dyno Therapeutics chỉ bằng suy luận — vượt trội hơn các mô hình protein chuyên dụng.

Nó đã tự thực hiện một nghiên cứu về sinh học gen đơn bào. Thiết kế, huấn luyện, phân loại. Mô hình cuối cùng vượt trội hơn các mô hình cùng loại được công bố trên tạp chí Science. Số lượng tham số chỉ bằng một phần trăm của mô hình sau.

One percent.

Đây là một con số đáng để dừng lại suy nghĩ ba giây.

Điều này cho thấy một sự thật: các mô hình lớn tổng quát đã bắt đầu phản công ngược lại trên lĩnh vực mà các mô hình khoa học chuyên ngành từng chiếm ưu thế, không phải bằng cách tích lũy sức mạnh tính toán, mà bằng cách tích lũy suy luận.

Cộng đồng nghiên cứu khoa học luôn có một nỗi lo tiềm ẩn: Liệu các mô hình tổng quát cuối cùng có sẽ nuốt chửng các mô hình chuyên dụng? Câu trả lời trước đây còn mơ hồ. Hôm nay Fable 5 đã đưa ra một mẫu không mấy thân thiện.

Bốn, giảm giá hơn một nửa, là sự hào phóng hay sự tính toán lạnh lùng

Đầu vào 10 USD, đầu ra 50 USD.

Nghe có vẻ không rẻ. Nhưng Dianne Penn của Anthropic đã đưa ra một câu quan trọng: Fable 5 cần ít token hơn để hoàn thành cùng một nhiệm vụ so với thế hệ trước.

Nói cách khác, giá đơn vị cao hơn nhưng tổng chi phí thấp hơn.

Đây là một chiến lược định giá rất "chuyên nghiệp".

Nó không chơi lá bài "giá thấp". Nó chơi lá bài "chi phí trên mỗi đơn vị kết quả".

Nó thông báo cho khách hàng: Đừng chỉ nhìn giá đơn vị token, hãy xem bạn tốn bao nhiêu để hoàn thành một phiếu công việc.

Câu chuyện này trước đây được các nhà cung cấp đám mây sử dụng. Bây giờ đến lượt các công ty mô hình lớn sử dụng. Đây là dấu hiệu của sự trưởng thành trong ngành.

Tại sao giá phiên bản thử nghiệm lại có thể giảm xuống một nửa? Có hai khả năng.

Một là chi phí suy luận thực sự đã giảm xuống. Hai là Anthropic đang cạnh tranh thị trường.

Tôi nghiêng về cả hai.

Sự sụp đổ của GPT-5.5 trên bảng xếp hạng mã hóa đã tạo ra một khoảng thời gian hiếm có cho Anthropic. Lúc này không hành động thì còn đợi lúc nào?

Nhưng Anthropic đã không đẩy giá xuống đáy. Họ đã để lại một khoảng. Tại sao?

Vì nó biết rằng, mình không chỉ bán token, mà còn bán một sự "an tâm".

Bản công cộng có hàng rào bảo vệ, lưu giữ lưu lượng doanh nghiệp trong 30 ngày để chống jailbreak. Chi phí tuân thủ này phải được chi từ lợi nhuận gộp.

Rẻ, nhưng không bán giá rẻ. Đó là tư thế của Anthropic.

Năm, "Mùi mô hình": Boris Cherny đã nhìn thấy gì

Boris Cherny, cha đẻ của Claude Code, đã sử dụng những từ ngữ rất nặng nề trong đánh giá này.

Anh ấy cho biết, Fable 5 là bước nhảy vọt về khả năng lớn nhất của Anthropic kể từ khi Opus 4.5 được phát hành vào tháng 11 năm 2025.

Sau khi phát hành Opus 4.5, Cherny gỡ bỏ IDE và chuyển sang lập trình chỉ bằng terminal. Việc này đã lan truyền trong cộng đồng phát triển một thời gian dài.

Và Fable 5 khiến anh cảm thấy Claude không còn chỉ là "đối tượng trí tuệ mã hóa", mà còn là "đối tác suy nghĩ và thiết kế".

Chi tiết thú vị nhất là gì?

Cherny phát hiện rằng Fable 5 sẽ chủ động thêm nhật ký, chủ động đo lường và chủ động xác minh khi gỡ lỗi. Trước khi tuyên bố "đã sửa xong", nó sẽ xác nhận xem mình có thực sự sửa xong hay không.

Nghe có vẻ như là lời nói thừa? Không.

Vấn đề phổ biến nhất của các mô hình trước đây là gì? Đó là “nói bậy một cách tự tin”. Đó là “Tôi đã sửa lỗi này rồi” — rồi bạn chạy thử, vẫn bị lỗi.

Fable 5's performance on this matter was described by Cherny as having a "large model vibe."

“大模型味” là gì?

Không phải là phong cách thuyết phục. Đó là bản năng kỹ sư tự nghi ngờ và tự xác minh lại.

Quan trọng hơn, hành vi này không phải do hệ thống nhắc nhở của Claude Code dạy ra. Đó là tính cách của chính mô hình.

Điều này mới thú vị.

Nếu một khả năng được kích hoạt bởi lời nhắc, thì nó dễ bị tổn thương, có thể chuyển giao và sao chép. Nếu đó là "tính cách" tự thân của mô hình, thì đó chính là hàng rào bảo vệ của Anthropic.

Anthropic trong hai năm qua đã luôn kể một câu chuyện rằng sự khác biệt của họ không chỉ là "thông minh hơn", mà là "đáng tin cậy hơn". Fable 5 là lần đầu tiên câu chuyện này có sự hỗ trợ dưới dạng sản phẩm.

Sáu, về vấn đề bảo mật, Anthropic đã không đi theo con đường thứ ba

Chúng ta quay lại vấn đề bảo mật.

Fable 5 đã triển khai bộ phân loại bảo mật độc lập. Khi gặp truy vấn rủi ro cao, hệ thống tự động chuyển sang Claude Opus 4.8. Dữ liệu từ Anthropic cho thấy: ảnh hưởng trung bình đến ít hơn 5% các phiên.

Điều này có nghĩa là gì?

Có nghĩa là trong hơn 95% trường hợp, người dùng không cảm nhận được sự hiện diện của hàng rào bảo vệ.

Điều đó có nghĩa là ít hơn 5% các yêu cầu "đánh bóng" còn lại sẽ được xử lý hạ cấp một cách lặng lẽ.

Đây là một sự hạn chế "dịu dàng".

Nhưng Anthropic cũng không hề tốt bụng. Dữ liệu lưu lượng doanh nghiệp được giữ trong 30 ngày. Trong thời gian này, nhân viên sẽ xem xét thủ công. Mọi lần xem đều được ghi nhật ký.

Đây là thiết kế tuân thủ và cũng là chuỗi bằng chứng pháp lý.

Đối với đối tác Glasswing, các hạn chế về an ninh mạng đã được gỡ bỏ. Các hạn chế về sinh dược sẽ được mở dần thông qua cơ chế truy cập tin cậy.

Vui lòng lưu ý bốn chữ "truy cập nhận". Điều này có nghĩa là việc mở không dựa trên số lượng người đăng ký, mà dựa trên năng lực.

Đọc toàn bộ cơ chế này, Anthropic đang làm một việc: biến chính mình thành "quản lý cấp phép phân cấp" trong lĩnh vực mô hình lớn.

Đây là sự khác biệt cơ bản trong cách tiếp cận của nó so với OpenAI.

Logic của OpenAI là "phát hành trước, sửa sau".

Logic của Anthropic là "phân cấp trước, sau đó phát hành".

Con đường nào đúng? Hiện chưa có câu trả lời. Nhưng thị trường sẽ bỏ phiếu bằng ví tiền.

Bảy: “Việc tăng giá mềm” dành cho người đăng ký

Mô hình mới đã sẵn sàng hoàn toàn trên API và phiên bản doanh nghiệp.

Cách xử lý người đăng ký thú vị hơn: dùng thử miễn phí đến ngày 22 tháng 6, sau ngày 23 tháng 6 sẽ chuyển sang thanh toán bằng điểm. Khi đủ năng lực tính toán, sẽ đưa vào đăng ký thông thường.

Translate into what?

Là kiểu tăng giá từng bước, như ếch bị luộc trong nước ấm.

Trước tiên cho bạn nếm vị ngọt, sau đó mới yêu cầu bạn chi tiền. Hiện tại năng lực sản xuất chưa đủ, nên đã tạo ra giải pháp tạm thời dưới dạng “trả tiền theo nhu cầu” cho các tính năng cao cấp.

Các nhà cung cấp điện toán đám mây di động đã chơi trò này nhiều năm rồi. Bây giờ các công ty mô hình lớn cũng bắt đầu đi theo con đường này.

Hình thức đăng ký không còn là "trả phí tháng để dùng thoải mái". Nó đang chuyển thành cấu trúc "gói cơ bản + mua thêm lượng sử dụng".

Đây có phải là một sự thụt lùi không?

Không. Đây là mô hình đã được kiểm chứng qua ba thập kỷ trong ngành SaaS. Các công ty mô hình lớn đang bắt đầu phát triển mô hình sinh lời trưởng thành.

Tám, sau Fable 5, cục diện ngành thay đổi như thế nào

Hãy mở rộng góc nhìn của chúng ta một chút.

Tháng 11 năm 2025, Opus 4.5 được phát hành. Anthropic đã củng cố vị trí trong "nhóm đầu về mô hình mã hóa".

Nửa đầu năm 2026, GPT-5.5 được phát hành. Thị trường chứng kiến đợt điều chỉnh rõ ràng đầu tiên đối với kỳ vọng vào OpenAI.

Ngày 9 tháng 6 năm 2026 (thứ Ba, giờ miền Tây Hoa Kỳ), Fable 5 và Mythos 5 sẽ được ra mắt đồng thời.

Bảy tháng. Thứ hạng của ba nhà sản xuất hàng đầu đã được sắp xếp lại một lần.

Điều này không có nghĩa là OpenAI thua. Video, âm thanh và sản phẩm tiêu dùng của OpenAI vẫn mạnh mẽ. Nhưng ở thị trường doanh nghiệp, trong mã nguồn và nghiên cứu khoa học, Anthropic lần này đã tạo ra một khoảng cách dẫn đầu.

Còn Google thì sao? Không ai nhắc đến. Điều đó chính là một tín hiệu.

Các nhà sản xuất trong nước thì sao? Cũng không ai nhắc đến. Nhưng họ chắc chắn đang thức khuya.

Việc di chuyển mã, suy luận khoa học và Agent thị giác — ba lĩnh vực này đều là những hướng bùng nổ tập trung của Fable 5. Đằng sau ba hướng này là ba thị trường ứng dụng trị giá hàng nghìn tỷ đô la.

Ai có thể theo kịp nhịp độ của ba lĩnh vực này, người đó vẫn còn ngồi trên bàn cờ. Ai không theo kịp, năm tới sẽ rất khó khăn.

Chín, Một vài câu hỏi vẫn chưa được trả lời

Đến đây, phải thừa nhận rằng có một vài câu hỏi hiện chưa có câu trả lời.

Đầu tiên, hành vi "tự xác minh" của Fable 5 có thể duy trì ổn định trong ngữ cảnh dài và hội thoại nhiều vòng không? Anthropic chỉ cung cấp bản demo và phản hồi từ khách hàng ban đầu, không phải dữ liệu mang tính thống kê.

Thứ hai, hiệu quả thực tế của Mythos 5 trong việc triển khai tại 200 tổ chức là như thế nào? Thông tin này được giữ bí mật nghiêm ngặt. Hiện tại, chúng ta chỉ có thể thấy khả năng của phiên bản công khai.

Thứ ba, khi nào đối thủ cạnh tranh sẽ phản công? OpenAI sẽ không im lặng, Google cũng vậy. Nửa cuối năm rất có thể sẽ là làn sóng ra mắt tiếp theo.

Thứ tư, giá sẽ còn giảm nữa không? Mức định giá 10/50 vẫn còn khá cao đối với các doanh nghiệp vừa và nhỏ. Khi công suất tính toán được giải phóng thêm, liệu có xuất hiện mức 5/25 hoặc thấp hơn không?

No one can answer these questions right now.

Nhưng có một điều chắc chắn.

Mười, lời kết

Ngành mô hình lớn đã bước vào một giai đoạn mới.

Trước đây, người ta so sánh “ai thông minh hơn”.

Hiện đang so sánh "ai kiểm soát tốt hơn".

Tương lai là cuộc cạnh tranh về ai có thể giúp khách hàng ngủ ngon hơn.

Fable 5 không phải là điểm kết thúc. Đó chỉ là bản trả lời mới mà Anthropic gửi đến ngành công nghiệp.

Thông tin chính của phiếu trả lời này rất đơn giản:

Khả năng sẽ tiếp tục tăng trưởng bùng nổ.

Nhưng quyền hạn sẽ được chia nhỏ ngày càng chi tiết.

Giá sẽ từ từ giảm xuống.

Sự tin tưởng sẽ trở thành thứ đắt giá nhất.

Ai sẽ là người cười到最后？

Không biết.

Nhưng vào thời điểm hôm nay, Anthropic đang ở một vị trí khá tốt.

Nó không kêu gọi "Chúng ta cần AGI".

Nó chỉ nghiêm túc chia một mô hình thành hai phần.

Một bản dành cho tất cả mọi người.

Một bản dành cho "người được tin tưởng".

Sự kiềm chế này, trong ngành AI hôm nay, gần như là một món hàng xa xỉ.

Còn hàng xa xỉ, thì chưa bao giờ rẻ.

Tài liệu tham khảo

Anthropic.Giới thiệu Claude Fable 5 và Claude Mythos 5. Anthropic official blog, June 9, 2026.
Anthropic. The Glasswing Program: Restricted Access to Frontier Capabilities. Tài liệu chính sách của Anthropic, tháng 6 năm 2026.
Đội ngũ Kiểm định FrontierCode. Kết quả Đánh giá Khó khăn Diamond: Tháng 6 năm 2026. Bảng xếp hạng FrontierCode, tháng 6 năm 2026.
Stripe Engineering. Migrating 50 Million Lines of Ruby in a Day with Claude Fable 5. Stripe technical blog, June 9, 2026.
Cherny, Boris. Claude Fable 5: From Coding Agent to Thinking Partner. Bài viết cá nhân và đăng trên X, ngày 9 tháng 6 năm 2026.
Dyno Therapeutics tiết lộ tài liệu nghiên cứu kết hợp, về kết quả thí nghiệm đối chứng dự đoán lắp ráp vỏ virus adenovirus, tháng 5–6 năm 2026.
Penn, Dianne. Phát biểu phỏng vấn truyền thông về dữ liệu phản hồi khách hàng liên quan đến định giá Fable 5 và tiêu thụ token, ngày 9 tháng 6 năm 2026.
Anthropic.Opus 4.5 Release Notes. Anthropic chính thức phát hành, tháng 11 năm 2025.