Claude của Anthropic hiện đã có khả năng “mơ” để cải thiện hiệu suất của tác nhân AI

Người máy sinh học có mơ không? Nếu chúng mơ, chúng sẽ mơ về những con cừu điện tử không?

Subquadratic

Ảnh chụp từ phim Blade Runner

Năm 1968, khi tác giả tiểu thuyết gốc của bộ phim khoa học viễn tưởng Blade Runner, Philip K. Dick, gõ lên máy đánh chữ câu hỏi trừu tượng và tiên phong này, ông có lẽ không hề nghĩ rằng hơn nửa thế kỷ sau, các ông lớn công nghệ ở Thung lũng Silicon sẽ đưa ra câu trả lời với vẻ mặt nghiêm túc.

Có, họ không chỉ có thể mơ thấy những con cừu điện tử, mà còn có thể trực quan hóa những giấc mơ đó.

Hôm qua, Anthropic đã ra mắt một loạt tính năng mới cho nền tảng xây dựng tác nhân Managed Agents tại hội nghị nhà phát triển ở San Francisco, bao gồm mở rộng bộ nhớ, đầu ra kết quả, hợp tác đa tác nhân và “mơ mộng (Dreaming)”.

Theo chính Anthropic, “bộ nhớ và mơ mộng cùng tạo thành một hệ thống bộ nhớ bền vững, có khả năng tự cải tiến”.

Subquadratic

Lại là mơ, lại là ký ức, những người bạn không quan tâm nhiều đến lĩnh vực AI có lẽ đều đầy câu hỏi: những từ ngữ thuộc về con người này, từ bao giờ đã có thể được áp dụng một cách trơn tru như vậy lên AI?

Ngay từ năm 2024, khi OpenAI ra mắt chuỗi o1, “một loạt mô hình AI được thiết kế để dành nhiều thời gian hơn để suy nghĩ trước khi phản hồi”, từ “suy nghĩ” được sử dụng một cách cực kỳ tự nhiên, đến mức không ai dừng lại để hỏi: một chương trình thống kê dự đoán token tiếp theo, vì sao lại gọi là suy nghĩ?

Tiếp theo là reasoning (suy luận), memory (trí nhớ), reflection (phản tư), imagining (tưởng tượng), từng bước một mang những hành động chỉ con người mới làm được lên buổi ra mắt sản phẩm.

Subquadratic

Chụp màn hình phim về giấc mơ "Red Rabbit"

“Suy nghĩ” còn có thể giải thích như một ẩn dụ, “trí nhớ” cũng tạm coi là sự mở rộng của thuật ngữ kỹ thuật, nhưng “mơ” thì thật sự quá đáng. Hàng ngàn năm nay, văn học, sử học và triết học vẫn chưa nghiên cứu rõ, vậy mà các công ty AI lại có thể trực tiếp nói: chúng tôi không chỉ tạo ra những cỗ máy có thể suy nghĩ, mà còn tạo ra những cỗ máy có thể mơ.

Điều gì khiến bạn mơ, ngoài việc mơ, chẳng có thuật ngữ kỹ thuật nào có thể mô tả chính xác sự việc này sao?

AI mơ cũng phải tốn tiền

Trong sự cố rò rỉ mã nguồn Claude Code, một số người dùng đã phát hiện Anthropic đang chuẩn bị một tính năng có tên Auto Dreaming. Lúc đó, mọi người đều thắc mắc: Liệu AI có giống con người chúng ta, cần ngủ nghỉ đầy đủ để trở nên tập trung và thông minh hơn không?

Subquadratic

Nhưng chỉ cần hiểu cách hoạt động của AI Agent hiện tại, bạn sẽ nhận ra rằng cái gọi là “mơ” thực chất chỉ là một quy trình xử lý lô nhật ký ngoại tuyến tự động.

AI Agent hiện nay thành thạo trong việc thực hiện các nhiệm vụ phức tạp có nhiều bước. Ví dụ: “Hãy giúp tôi nghiên cứu báo cáo tài chính mới nhất của năm đối thủ cạnh tranh này và tổng hợp thành bảng.” Trong quá trình này, Agent cần chuyển đổi giữa các trang web khác nhau, đọc nhiều tài liệu, sử dụng các công cụ khác nhau, và thậm chí có thể gặp phải cơ chế chống thu thập dữ liệu, buộc phải thử lại.

Sau khi hoàn thành chuỗi nhiệm vụ trực tuyến dài và phức tạp này, nền tảng của Agent sẽ để lại một lượng lớn nhật ký hoạt động.

Subquadratic

Hình ảnh được tạo bởi AI

Tính năng "mơ" của Anthropic giúp Agent tái cấu trúc lại các bản ghi lịch sử trong thời gian rảnh. Nó sẽ tìm kiếm các mô hình, chẳng hạn như phát hiện ra "mỗi khi gặp hộp thoại này, nhấp vào góc trên bên phải để đóng", từ đó tối ưu hóa đường dẫn thao tác lần sau.

「Nhớ」 phụ trách ghi lại những điều học được trong quá trình làm việc, trong khi «mơ» tinh lọc những ký ức này giữa các phiên hội thoại và chia sẻ chúng giữa các Agent khác nhau.

Nói một cách đơn giản, đây là một cơ chế học tăng cường dựa trên dữ liệu lịch sử và tự sửa lỗi.

Subquadratic

Giới thiệu về Dream: https://platform.claude.com/docs/en/managed-agents/dreams

Trong hội nghị nhà phát triển lần này, Dreams trong Managed Agents đã được cập nhật, đây là một tác vụ xử lý nền, chúng ta cần kích hoạt thủ công. Claude có thể đọc tối đa 100 phiên hội thoại và tạo ra một bộ nhớ hoàn toàn mới để chúng ta xem xét trước khi quyết định có sử dụng hay không.

Trong khi đó, AutoDream đã được triển khai âm thầm trong Claude Code, sau mỗi vòng trò chuyện với Agent, Claude Code sẽ kiểm tra nền tảng xem “có nên mơ không”, mặc định là chạy mỗi 24 giờ.

Tương tự chức năng mơ, Hermes Agent cũng có. Hermes Agent nổi bật ở khả năng tự học và tiến hóa, không chỉ hỗ trợ tự tổng kết kinh nghiệm từ các nhiệm vụ trước đó và lưu vào tệp bộ nhớ.

Subquadratic

Một tính năng có tên Curator còn có thể tự động sắp xếp các hướng dẫn thao tác được rút ra thành Skill.

Các Skill này sẽ được đánh điểm, các Skill trùng lặp sẽ được hợp nhất, các Skill không sử dụng trong thời gian dài sẽ được tự động lưu trữ, thậm chí còn có các giai đoạn sống như active, stale, archived. Chúng ta còn có thể ghim các Skill quan trọng để hệ thống không tự động xóa bỏ.

OpenClaw trong các bản cập nhật gần đây cũng đã thêm các cơ chế liên quan, như bộ nhớ bền vững xuyên hội thoại, lịch trình tác vụ theo thời gian, thực thi cách ly các Agent con, cũng như chức năng mơ mộng trực tiếp mang tên Dreaming.

Subquadratic

Giấc mơ của OpenClaw: https://docs.openclaw.ai/concepts/dreaming

Trong cơ chế mơ của OpenClaw, nó tóm tắt hành trình giấc mơ thành ba giai đoạn: light, REM, deep. Hai giai đoạn đầu tiên chịu trách nhiệm sắp xếp, suy ngẫm và tổng hợp chủ đề, trong khi deep mới thực sự ghi nội dung vào bộ nhớ dài hạn MEMORY.md.

Subquadratic

Sự củng cố trong giai đoạn ngủ sâu sẽ được quyết định bởi 6 tín hiệu có trọng số, liệu có cần ghi vào trí nhớ dài hạn hay không. Sáu tín hiệu này bao gồm tần suất, tính liên quan, đa dạng truy vấn, tính cập nhật, mức độ lặp lại xuyên ngày và độ phong phú khái niệm.

Subquadratic

Hình ảnh được tạo bởi AI

Ghi vào bộ nhớ dài hạn sẽ tạo ra hai tệp: một tệp trạng thái dành cho máy, được lưu trong memory/.dreams/; và một tệp ghi chép có thể đọc được dành cho người dùng, được ghi vào DREAMS.md và các báo cáo được tạo theo từng giai đoạn.

Ngoài ra, Dreaming có thể chạy tự động theo lịch trình, mặc định chạy một chu trình đầy đủ mỗi ngày lúc 3 giờ sáng theo thứ tự light → REM → deep.

Ngoài đầu ra của giấc mơ, OpenClaw còn duy trì một tài liệu gọi là Dream Diary, hệ thống sẽ tự động tạo ra một “nhật ký giấc mơ” ghi lại quá trình sắp xếp ký ức theo cách kể chuyện, nhấn mạnh tính giải thích được và có thể kiểm tra, thay vì sử dụng cơ sở dữ liệu dạng hộp đen.

Trong thần kinh học, có một hiểu biết rất kinh điển: thông tin con người tiếp nhận vào ban ngày sẽ được đưa vào hệ thống lưu trữ tạm thời trước; trong quá trình ngủ, não bộ sẽ tái phát, củng cố và làm sạch những thông tin này, giữ lại những điều quan trọng và loại bỏ những điều vô nghĩa.

Subquadratic

Hình ảnh được tạo bởi AI

Chúng ta sẽ không nhớ màu sắc của từng chiếc xe trên đường đi làm hôm qua, nhưng sẽ nhớ cách đến công ty.

Những giấc mơ này, nghe thì giống hệt như con người chúng ta mơ, nếu phải tìm điểm khác biệt, có lẽ chỉ là khi Claude mơ, nó vẫn đang tiêu tốn Token của chúng ta.

Tuy nhiên, Anthropic và OpenAI đều không chọn đặt tên cho nó là “tối ưu hóa dựa trên phiên” hoặc “tinh chỉnh sau nhiệm vụ” — những cái tên thiên về kỹ thuật.

Sau tất cả, khi biến những cái tên phức tạp đó trực tiếp thành “mơ mộng”, chúng ta không còn cảm nhận được chức năng phần mềm, mà giống như một “sự sống kỹ thuật số có hoạt động nội tâm”.

Bộ nhớ của AI là những ngữ cảnh lặt vặt

Khi đã nhắc đến "mơ", không thể không đề cập đến điều kiện tiên quyết của nó, trí nhớ (Memory).

Trong thời gian qua, từ khóa nổi bật nhất trong cộng đồng AI đã chuyển từ prompt engineering sang context engineering, skill engineering và harness engineering, nhưng bất kể thay đổi thế nào, context engineering vẫn là lĩnh vực có giá trị nhất hiện nay.

Các lớp chồng lên nhau gồm: thông báo hệ thống, đầu vào của người dùng, hội thoại ngắn hạn, trí nhớ dài hạn, tài liệu được truy xuất, đầu ra từ các công cụ và lời gọi Skill, trạng thái hiện tại của người dùng, chính là “bối cảnh” mà agent thực sự sử dụng.

Làm cho Agent có thể ghi nhớ nhiều hơn và ghi lại những nội dung hữu ích hơn luôn là một thách thức trong thời gian dài qua.

Subquadratic

Manus đã đăng một bài blog kỹ thuật vào năm ngoái, tập trung vào cách Manus tối ưu hóa kỹ thuật ngữ cảnh. Bài viết đề cập đến việc xác định tỷ lệ hit của KV-Cache là một trong những chỉ số đơn lẻ quan trọng nhất đối với AI Agent trong môi trường sản xuất. Đồng thời, ở cấp độ gọi công cụ, ưu tiên thực hiện “che khuất” thay vì “xóa bỏ”; cùng với các phương pháp như sử dụng hệ thống tệp làm ngữ cảnh cuối cùng.

Để hiểu về KV Cache (bộ nhớ đệm khóa-giá trị), hãy tưởng tượng mô hình lớn như một người mắc chứng ám ảnh cưỡng chế cực độ, chỉ có thể đọc một chữ mỗi lần.

Khi xử lý một câu, nó sẽ tính toán một vector Key (khóa) và một vector Value (giá trị) cho từng token được tạo ra. Để tránh phải tính lại từ đầu mỗi lần, nó sẽ lưu trữ các cặp khóa-giá trị (K, V) này, đó chính là KV Cache.

Subquadratic

KV Cache (bộ nhớ đệm khóa-giá trị) là một kỹ thuật tăng tốc cấp底层 được sử dụng bởi các mô hình lớn khi tạo văn bản, nhằm “đổi không gian lấy thời gian”. Bộ nhớ đệm giúp mô hình không cần tái tính toán tất cả các từ trước đó khi dự đoán từ tiếp theo. Hình ảnh được tạo bởi AI.

Khi hội thoại tiếp tục, KV Cache sẽ liên tục được lưu trữ. Thông thường, khi đối mặt với các mô hình lớn có ngữ cảnh lên tới 128k, một mô hình 70B tham số chạy đầy đủ ngữ cảnh 128k chỉ riêng KV Cache đã có thể chiếm hết 64 GB bộ nhớ GPU.

Đó cũng là lý do tại sao cửa sổ ngữ cảnh của hầu hết các mô hình hiện nay đều ở mức tối đa hàng triệu.

Hôm qua, công ty mới nhận được vòng tài trợ hạt giống 29 triệu USD, Subquadratic, đã công bố mô hình SubQ mới trên X, nhấn mạnh vào ngữ cảnh dài hơn.

Subquadratic

SubQ tuyên bố hỗ trợ cửa sổ ngữ cảnh lên đến 12 triệu token, đây là cửa sổ ngữ cảnh lớn nhất hiện nay trong tất cả các mô hình lớn.

Mặc dù chưa có bài báo khoa học hay tài liệu hướng dẫn mô hình, video giới thiệu cho biết, tuyến đường cốt lõi của SubQ là chuyển từ sự chú ý "dày đặc" của Transformer truyền thống sang kiến trúc "bậc hai / tuyến tính mở rộng" với sự chú ý thưa thớt. Kiến trúc mới hứa hẹn giải quyết vấn đề chi phí tính toán tăng vọt khi ngữ cảnh càng dài.

Subquadratic

Kết quả kiểm tra được đưa ra cũng rất ấn tượng: với 1 triệu token, tốc độ tăng hơn 50 lần và chi phí giảm hơn 50 lần; với 12 triệu token, nhu cầu về sức mạnh tính toán có thể giảm gần 1000 lần so với các mô hình tiên tiến nhất.

Trên bộ chuẩn RULER 128K độ dài ngữ cảnh, Subquadratic cho biết SubQ đạt độ chính xác 95% với chi phí 8 USD, so với 94% độ chính xác và chi phí khoảng 2.600 USD của Claude Opus, giảm chi phí khoảng 300 lần.

Hoặc mở rộng cửa sổ ngữ cảnh, hoặc để mô hình học cách mơ, tự loại bỏ một số thứ.

Đó cũng là lý do tại sao các sản phẩm Agent như Anthropic hiện phải ra mắt tính năng Dreaming. Trong điều kiện cửa sổ ngữ cảnh bị giới hạn, AI thông minh hơn không chỉ có thể dựa vào việc nhét thêm nhiều nội dung hơn, mà còn cần phải tập trung vào những điểm chính xác.

Thừa nhận máy móc chỉ là máy móc, khó hơn tưởng tượng

Hiểu được cơ chế mơ và ghi nhớ của AI, chúng ta có thể phần nào nhận ra mối quan hệ giữa nó và các hoạt động của con người.

Nhưng khi gộp tất cả những từ ngữ mà các công ty AI tạo ra để dùng cho máy móc lại với nhau — OpenAI với “thinking” (suy nghĩ), thuật ngữ phổ biến trong ngành “memory” (bộ nhớ) và “hallucination” (ảo giác), Anthropic lần này với “dreaming” (mơ), cùng những đức tính và trí tuệ trong Hiến chương của Anthropic.

Chúng ta có thể thấy, các công ty AI không chỉ đơn thuần bán sản phẩm, mà còn đang tái phân phối quyền sở hữu từ ngữ trong khái niệm “con người”. Mỗi lần chiếm dụng một từ, ranh giới giữa máy móc và con người lại mờ đi một chút.

Subquadratic

Ngôn ngữ định hình kỳ vọng, kỳ vọng định hình mức độ dung nạp, và mức độ dung nạp quyết định chúng ta sẵn sàng giao bao nhiêu thứ cho nó. Đây là một chuỗi dài, nhưng điểm khởi đầu chính là những từ ngữ vô hại trong buổi ra mắt.

Ảnh hưởng ẩn sâu hơn là sự phân bổ trách nhiệm. Khi các công cụ được mô tả như những thực thể có khả năng “suy nghĩ”, “ghi nhớ”, “giá trị”, chúng ta sẽ tự nhiên coi chúng là những “chủ thể hành động” độc lập khi xảy ra sự cố, và cho rằng chính AI này cần được “giáo dục”, “hiệu chỉnh”, “hiệu chuẩn”.

Những người thực sự nên bị chất vấn là công ty đã triển khai chương trình này vào quy trình làm việc của chúng ta và nhóm sản phẩm đã viết ra từ “dreaming”. Chỉ cần thay đổi một từ, người ngồi trên ghế bị cáo cũng thay đổi.

Và khi chúng ta nhìn vào một cỗ máy có thể “suy nghĩ”, “ghi nhớ”, và giờ đây còn có thể “mơ”, chúng ta cũng bắt đầu vô thức tin rằng bên trong nó có điều gì đó. Vì nếu thừa nhận đây chỉ là một cỗ máy, trải nghiệm “Tôi đang trò chuyện với một thực thể có khả năng suy nghĩ” sẽ tan biến, trở lại với mối quan hệ lạnh lùng như một công cụ.

Subquadratic

Giới thiệu tính năng White Day Dream | Hình ảnh được tạo bởi AI

Tôi đã nghĩ ra rồi, Dreaming – mơ mộng là xử lý nội dung quá khứ, tiếp theo các công ty AI sẽ ra mắt Daydreaming – mơ ban ngày, để diễn tập tương lai.

Nói cách khác, việc mơ mộng hoặc phân tâm cho phép Agent trong trạng thái hoạt động, sử dụng một phần nhỏ năng lực tính toán rảnh rỗi, kết hợp với dự án đang diễn ra, để đồng thời thực hiện các tạo sinh mang tính khám phá, chuẩn bị cho các nhiệm vụ có thể xảy ra trong tương lai.

Bài viết này đến từ tài khoản công chúng WeChat "APPSO", tác giả: APPSO - Khám phá sản phẩm của tương lai