Anthropic ra mắt Claude Fable 5, tái cấu trúc mô hình hợp tác giữa con người và máy móc.

Tác giả bài viết, nguồn: Sina Trí tuệ

[Giới thiệu] Sau khi Fable 5 được phát hành, nhóm Claude Code cho biết họ không còn kiểm tra xem Claude có hoàn thành công việc đúng hay không, mà bắt đầu kiểm tra xem nó có đang làm đúng việc hay không. Các nhà phát triển đã chuyển từ vai trò giám sát đầu ra mã nguồn sang vai trò sản phẩm xác định tiêu chuẩn, và tiêu chí đánh giá kỹ sư xuất sắc cũng vì thế mà thay đổi.

Trong một đêm, toàn mạng đã bị tràn ngập bởi hình ảnh chữ “5” được tạo thành từ những con bướm bay lượn.

Chủ thể của hình ảnh này chính là mô hình mạnh nhất vừa được Anthropic ra mắt—Claude Fable 5.

https://www.anthropic.com/news/claude-fable-5-mythos-5

Anthropic chính thức công bố, đây là mô hình Mythos đầu tiên của họ được thiết kế an toàn cho các kịch bản phổ quát, với khả năng vượt trội so với bất kỳ mô hình nào từng được công bố trước đây.

Tiếp theo, đội ngũ chính thức thông báo xóa sạch tất cả giới hạn tốc độ 5 giờ và hàng tuần của người dùng, để mọi người "tự do tận hưởng Fable 5".

Ở phía phát triển, mọi thứ cũng thay đổi hoàn toàn trong một đêm.

Theo chính lời của đội ngũ Claude Code: Trước đây, họ quan tâm đến việc Claude có hoàn thành công việc đúng không; bây giờ, họ quan tâm đến việc Claude có đang làm những điều đúng đắn không.

Thariq Shihipar, thành viên nhóm Claude Code, cho rằng Fable là một bước đột phá lớn trong lĩnh vực mô hình, sẽ thay đổi cách con người hợp tác với Claude. Với công cụ mạnh mẽ này, “đã đến lúc nghĩ lớn hơn”.

Thariq là tác giả của công cụ AskUserQuestion. Chức năng của công cụ này là giúp AI đặt câu hỏi ngược lại với bạn: trước khi bắt tay vào viết mã, hãy đưa ra một loạt câu hỏi trắc nghiệm để làm rõ các chi tiết triển khai, các trường hợp biên và các sự đánh đổi. Càng chạy lâu, khả năng tự đặt câu hỏi trước để làm rõ vấn đề của mô hình càng trở nên quan trọng.

Thariq cũng chia sẻ những thay đổi mà Fable 5 mang lại theo tổng kết của đội ngũ—

Ba việc đã được sửa đổi: Bạn giao nhiệm vụ cho nó như thế nào, bạn nghiệm thu nó như thế nào, và một người bạn có thể đồng thời điều khiển bao nhiêu cái nó.

Hãy xem ví dụ Stripe trong bài đăng của Anthropic: Việc di chuyển toàn bộ kho mã Ruby với 50 triệu dòng mã, nếu làm bằng tay cần hơn hai tháng, nhưng Fable 5 hoàn thành trong một ngày.

Một kho mã Ruby với 50 triệu dòng, nếu thực hiện chuyển đổi toàn bộ bằng tay, một đội ngũ sẽ mất hơn hai tháng; nhưng Fable 5 chỉ mất một ngày.

Nén hơn hai tháng thành một ngày, điều này không còn đơn thuần là tăng tốc nữa, mà sự phân công giữa con người và AI lại một lần nữa được định nghĩa lại.

Từ người giám sát quá trình đến sản phẩm quản lý tiêu chuẩn

Trọng tâm của đợt nâng cấp này không phải là điểm số.

Anthropic định vị Claude Code là "môi trường lập trình tác nhân (agentic coding environment)".

Nó có thể đọc tệp, thực hiện lệnh và sửa mã, tự mình đẩy tiến vấn đề khi bạn đang nhìn chằm chằm, ngắt quãng, hoặc thậm chí rời đi.

Đây mới là điểm then chốt: Nó đã có thể tự làm việc rồi thì bạn còn phải giám sát làm gì? Trong các thực hành tối ưu chính thức của Claude Code, có đề cập đến câu sau:

Nếu bạn không cung cấp cho Claude một danh sách kiểm tra có thể thực hiện, chính bạn sẽ trở thành vòng lặp xác minh đó. Mỗi lỗi đều phải chờ bạn tự phát hiện.

Thực hành tốt nhất chính thức của Claude Code: Cung cấp cho Claude một kiểm tra có thể chạy, kiểm thử, xây dựng hoặc so sánh ảnh chụp màn hình, nếu không, chính bạn sẽ trở thành vòng lặp xác minh

Nghĩa là trước đây, bạn là người giám sát, ngồi trước màn hình theo dõi từng bước nó viết, sai một dòng thì sửa một dòng. Bây giờ thì khác rồi. Công việc của bạn đã từ “chỉ đạo từng bước” chuyển thành “xác định mục tiêu, cung cấp đủ ngữ cảnh và thiết lập tiêu chuẩn nghiệm thu”.

Nghe thì không phức tạp, nhưng khi triển khai lại không dễ dàng, các thực tiễn tốt nhất từ phía chính thức cũng đã đưa ra hướng dẫn.

Đừng ngay lập tức yêu cầu nó viết mã, hãy để nó khám phá trước, sau đó lên kế hoạch, và cuối cùng mới bắt tay vào thực hiện, tránh để nó埋头解决了一个错的问题.

Một điểm quan trọng khác: sử dụng AskUserQuestion vừa đề cập để yêu cầu Claude ngược lại phỏng vấn bạn, từng bước đặt câu hỏi về các chi tiết triển khai bạn chưa suy nghĩ rõ, các tình huống biên giới và các lựa chọn cân nhắc, cuối cùng tổng hợp thành một file SPEC.md.

Đừng lo lắng rằng những công việc chuẩn bị này sẽ lãng phí thời gian. Khi mô hình có đủ năng lực để tự thực hiện công việc và diễn đạt rõ yêu cầu, giá trị của nó sẽ lớn hơn nhiều so với việc bạn phải ngồi giám sát nó viết mã.

Đây chính xác là điều đã xảy ra với đội ngũ Claude Code: từ việc xác minh trước đây xem Claude có làm đúng việc hay không, giờ đây chuyển sang xác minh xem nó có đang làm đúng việc hay không.

Buông tay thật dễ chịu, làm thế nào để tin tưởng?

Thả lỏng nghe có vẻ tuyệt vời, nhưng tại sao lại tin tưởng Claude?

Điểm khiến người ta đau đầu nhất là nó sai nhưng lại tỏ ra rất chắc chắn. Hơn nữa, mô hình càng mạnh, đầu ra càng giống thật, khiến lỗi càng khó phát hiện ngay lập tức.

Claude sẽ dừng lại khi "dường như đã hoàn thành", nhưng đây lại chính là tín hiệu nguy hiểm nhất.

Không có một kiểm tra nào hoạt động được, “trông như đã hoàn thành” trở thành tiêu chí duy nhất của Claude, cuối cùng có thể trở thành vấn đề của bạn.

Giải pháp chính thức là: cung cấp cho nó một thứ có thể xác định “đạt” hoặc “trượt”.

Ví dụ: một bộ kiểm thử, mã thoát của một bản xây dựng, và một ảnh chụp màn hình so sánh kết quả với bản thiết kế. Nó thực hiện công việc, chạy kiểm tra, đọc kết quả, rồi điều chỉnh, cho đến khi kiểm tra vượt qua. Vòng lặp này tự động khép kín.

Tiếp theo, hãy sử dụng /goal trong Claude Code. Bạn đặt một điều kiện hoàn thành, và nó sẽ tiếp tục thực hiện xuyên suốt các vòng mà không cần bạn phải nhắc nhở từng vòng.

Sau mỗi vòng hoàn thành, một mô hình nhỏ khác sẽ ra điểm: nó không phải là Claude thực hiện công việc, mà là một mô hình nhỏ hơn, nhanh hơn và rẻ hơn (mặc định là Haiku), chuyên đọc lại các điều kiện hoàn thành và cuộc hội thoại trong vòng đó, rồi đưa ra một câu đánh giá là “Đạt” hay “Không đạt”, kèm theo một lý do. Nếu chưa đạt, sẽ tiếp tục thực hiện; nếu đạt, hệ thống sẽ tự động kết thúc.

Lệnh /goal của Claude Code: Thiết lập điều kiện hoàn thành, mỗi vòng một mô hình nhỏ sẽ đánh giá xem đã đạt chưa, nếu chưa đạt thì tiếp tục thực hiện

Trông giống như không người lái. Nhưng có một điểm cần làm rõ: mô hình nhỏ dùng để đánh giá không tự mình thực hiện lệnh hay tự đọc tệp tin; nó chỉ có thể xem các bằng chứng mà Claude đưa ra trong cuộc hội thoại.

Nói cách khác, việc chu trình này vận hành trơn tru hay không hoàn toàn phụ thuộc vào việc Claude có đưa ra những thứ thực sự hay không. Nếu điều kiện được đặt lỏng lẻo hơn, hoặc Claude chỉ nói suông rằng “đã chạy qua”, thì trình đánh giá vẫn có thể vượt qua.

Do đó, việc giao nhận tự kiểm tra không có nghĩa là không có người duyệt bài.

Dám buông tay là dựa vào việc luôn có thể nhìn thấy bằng chứng, chứ không phải đánh cược vào việc mô hình thông minh.

Một người bắt đầu điều khiển hàng trăm tác nhân thông minh

Nếu /goal là để một Claude làm việc lâu hơn, thì Dynamic workflows là để một nhóm Claude cùng làm việc.

Cách chơi là Claude sẽ viết cho bạn một đoạn mã JavaScript, đoạn mã này sẽ điều phối hàng loạt tiểu trí tuệ chạy ở nền.

Các tình huống được chính thức đề xuất bao gồm kiểm toán mã toàn bộ cơ sở dữ liệu, di chuyển lớn với 500 tệp, các vấn đề nghiên cứu cần xác minh chéo, v.v.

Quy mô hoạt động lớn đến đâu? Một lần chạy có thể huy động tối đa 1000 tác nhân, đồng thời chạy tối đa 16 tác nhân.

Bảng ràng buộc workflow trong tài liệu chính thức của Claude Code, phần được làm nổi bật cho thấy tối đa 1000 tác nhân mỗi lần chạy

Claude Code thậm chí còn tích hợp sẵn một workflow gọi là /deep-research, chuyên biệt để tách một câu hỏi thành nhiều góc độ tìm kiếm, xác minh chéo và bỏ phiếu loại bỏ những lập luận không vững chắc, cuối cùng cung cấp cho bạn một báo cáo có trích dẫn.

Điều này có nghĩa gì? Claude Code đã không còn chỉ là khung trò chuyện bên trong terminal đồng hành cùng bạn nữa, mà đang tiến gần hơn đến một hệ thống đại lý kỹ thuật có thể chạy liên tục, sắp xếp và tái sử dụng.

Một người có thể điều khiển một đạo quân AI chỉ bằng một lệnh trong /workflows.

Tự chủ không có nghĩa là thay thế

Fable 5 thực sự mạnh hơn.

Công ty chính thức cho biết nó có thể tự hoạt động trong thời gian dài hơn bất kỳ mô hình Claude nào trước đây, và càng nhiệm vụ dài và phức tạp, thì nó càng dẫn xa các đối thủ, nhưng điều này không có nghĩa là lập trình viên có thể hoàn toàn buông tay.

Ngược lại, các thực hành tốt nhất của chính thức nhấn mạnh bốn nhiệm vụ phải do con người thực hiện: xác định tiêu chuẩn xác minh, quản lý quyền truy cập, kiểm soát ngữ cảnh và xem xét bằng chứng.

Nó thậm chí còn liệt kê cụ thể một số mô hình thất bại phổ biến cần tránh, trong đó có một loại lỗi gọi là “khoảng cách tin tưởng rồi mới xác minh” (The trust-then-verify gap), chính là tình huống Claude đưa ra một kết quả trông có vẻ hợp lý nhưng thực tế lại không xử lý các ranh giới.

Only one solution: You can only publish it if you can verify it; if you can't verify it, don't publish it.

Chi phí và rào cản cũng không thể bỏ qua.

Giá của Fable 5 là 10 USD cho mỗi triệu token đầu vào và 50 USD cho mỗi triệu token đầu ra. Người anh em song sinh mạnh mẽ hơn, Mythos 5, sử dụng cùng mô hình nền tảng nhưng đã nới lỏng một số biện pháp bảo mật, hiện chỉ được mở cho một nhóm nhỏ các chuyên gia phòng thủ mạng và nhà cung cấp cơ sở hạ tầng.

Fable 5 còn mang theo một lớp hàng rào phân loại.

Khi gặp các chủ đề nhạy cảm như an ninh mạng, sinh hóa học, nó sẽ tự động chuyển câu trả lời cho Opus 4.8 xử lý. Theo thông báo chính thức, hơn 95,0% phiên trò chuyện không kích hoạt cơ chế chuyển tiếp này, nhưng các biện pháp bảo vệ được thiết lập khá bảo thủ, đôi khi có thể ảnh hưởng đến các yêu cầu bình thường.

Đủ can đảm nhận nhiệm vụ dài hạn không đồng nghĩa với việc buông tay hoàn toàn. Càng tự chủ, càng cần biết cách nghiệm thu.

Trở lại với câu nói của Thariq: Đã đến lúc trở nên tham vọng hơn.

Sự ẩn ý đằng sau tham vọng này là khiến bạn dám giao phó những vấn đề lớn hơn. Nhưng quá trình buông bỏ vẫn cần sự kiểm soát, điều này giống như một nghệ thuật kết hợp giữa kinh nghiệm và trực giác.

Quy tắc là điểm xuất phát, không phải giáo điều

Sau khi nêu ra nhiều quy tắc và phương pháp như vậy, Anthropic đã bổ sung một điều: tất cả những điều này đều là điểm khởi đầu, không phải giáo điều.

Nói cách khác, bộ thực hành tốt nhất này hoạt động hiệu quả trong hầu hết các trường hợp, nhưng không nhất thiết phù hợp với mọi tình huống.

Đôi khi, bạn nên giữ nguyên ngữ cảnh vì bạn đang giải quyết một vấn đề phức tạp, và lịch sử đó rất quan trọng; đôi khi, bạn nên bỏ qua kế hoạch và để Claude bắt đầu ngay, vì nhiệm vụ vốn mang tính khám phá; đôi khi, một hướng dẫn mơ hồ lại là chính xác, vì bạn muốn xem nó hiểu thế nào trước khi quyết định có nên giới hạn nó hay không.

The trick is to pay attention to what works—there’s no one-size-fits-all rule.

Khi Claude làm tốt, hãy nhớ lại bạn đã làm gì: cách bạn viết lời nhắc, cung cấp bối cảnh nào, sử dụng chế độ nào; khi nó bị đình trệ, hãy suy ngẫm: lời nhắc quá chung chung, hay nhiệm vụ quá lớn để xử lý một lần?

Dần dần, bạn sẽ phát triển một trực giác mà không có bất kỳ hướng dẫn nào có thể dạy bạn: khi nào nên chi tiết, khi nào nên để trống; khi nào nên lên kế hoạch, khi nào nên để nó tự khám phá—

Đến bước đó, bạn mới thực sự hiểu cách làm việc cùng nó.

Khi Fable 5 có thể hoàn thành công việc của hơn hai tháng trong một ngày, kỹ năng hiếm có nhất của các lập trình viên đã thay đổi: không còn là viết mã tốt, mà là xác định thế nào là mã tốt, và định nghĩa của việc “biết lập trình” cũng đang bị thay đổi lặng lẽ.

Kỹ sư có giá trị nhất trong tương lai sẽ không còn là người giám sát mã nguồn, mà là người giỏi đặt câu hỏi, xác định tiêu chuẩn và nghiệm thu.

Tài liệu tham khảo:

https://www.anthropic.com/news/claude-fable-5-mythos-5

https://code.claude.com/docs/en/best-practices

https://code.claude.com/docs/en/common-workflows

https://x.com/ClaudeDevs/status/2064399512664526853