Anthropic và DeepMind báo hiệu sự gia tốc trong tự cải thiện của AI

icon MarsBit
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Các phát triển về AI và tin tức tiền điện tử vẫn tiếp tục gắn kết khi đồng sáng lập Anthropic, Jack Clark, ước tính có 60% khả năng AI đạt được khả năng tự cải thiện vào cuối năm 2028. Một cuộc tranh luận với Eliezer Yudkowsky đã theo sau về các rủi ro tiềm ẩn. Vào tháng 6 năm 2026, Anthropic báo cáo hơn 80% mã nguồn của họ được AI viết ra, với năng suất tăng lên. CEO của DeepMind, Demis Hassabis, đã điều chỉnh khung thời gian cho AGI của mình sang năm 2029, gọi đây là một khả năng thực tế. Cả hai công ty hiện đều nhấn mạnh sự cấp bách trong tiến trình phát triển AI. Dữ liệu lạm phát và phản ứng thị trường có khả năng sẽ theo dõi sát những thay đổi này.

Vào ngày 4 tháng 5 năm 2026, Jack Clark, đồng sáng lập của Anthropic, đã đăng một bài viết trên nền tảng mạng xã hội X. Ông nói: “Bây giờ tôi tin rằng xác suất xảy ra tự cải tiến đệ quy trước cuối năm 2028 là 60%.”

Chỉ vài phút sau khi bài đăng được đăng, một nhà nghiên cứu lâu năm trong lĩnh vực an toàn AI, Eliezer Yudkowsky, đã bình luận: “Chúng ta sẽ cùng chết.” Ông ngay lập tức trích dẫn một phép ẩn dụ về lỗi thiết kế của lò phản ứng hạt nhân Chernobyl RBMK, ngụ ý rằng hệ thống đang được khởi động này không ai thực sự biết cách tắt nó.

Cuộc hội thoại diễn ra trong vài chục giây này giống như một que diêm được quẹt lên, làm bùng lên những cuộc thảo luận từng bị ẩn giấu trong các bài báo kỹ thuật và đánh giá nội bộ. Khái niệm Tự cải tiến đệ quy (Recursive Self-Improvement, RSI) — nơi hệ thống AI không chỉ tối ưu đầu ra mà còn tự chủ cải tiến chính quá trình cải tiến của mình, cuối cùng tạo ra các hệ thống kế thừa mạnh mẽ hơn chính nó — đã được đồng sáng lập Anthropic đưa vào đồng hồ đếm ngược với xác suất 60% xảy ra trước cuối năm 2028.

Một tháng sau, Anthropic chính thức công bố một bài viết dài với tiêu đề “When AI builds itself”. Bài viết do Marina Favaro và Jack Clark đồng viết, được phát hành bởi Anthropic Institute – tổ chức vừa thành lập vào tháng 3. Bằng cách sử dụng một chuỗi dữ liệu nội bộ chưa từng được công bố trước đó cùng một cấu trúc kể chuyện được hiệu chỉnh cẩn thận, Anthropic đã gửi đến thế giới bên ngoài một tấm thẻ tín hiệu tăng tốc với độ chính xác cao. Trên tấm thẻ này, cả hai thông điệp “Chúng tôi chưa đến đó” và “Nhưng nó có thể đến nhanh hơn nhiều so với hầu hết các tổ chức sẵn sàng” đều được ghi rõ.

Cùng tháng đó, CEO của DeepMind, Demis Hassabis, đã sử dụng một cách diễn đạt chưa từng xuất hiện trước công chúng trên sân khấu Google I/O: nhân loại đang đứng ở sườn núi của điểm kỳ dị. Trong cuộc phỏng vấn sau đó, ông đã điều chỉnh khung thời gian cho trí tuệ nhân tạo tổng quát (AGI) từ “ngay sau năm 2030” thành “năm 2029 là một khả năng thực sự”, và thừa nhận việc sử dụng ngôn ngữ kịch tính là “có chủ đích khiêu khích” nhằm tạo cảm giác cấp bách cho chính phủ, các nhà kinh tế và công chúng.

Hai tổ chức hàng đầu, vốn lấy an toàn làm nền tảng và lâu nay đóng vai trò là lực lượng kiềm chế trong ngành AI, gần như cùng lúc điều chỉnh mức độ và tần suất phát ngôn công khai. Chính thời điểm này cần được xem như một sự kiện độc lập.

Một bài viết dài được hiệu chỉnh chính xác

Trong bài viết dài được công bố vào ngày 4 tháng 6, Anthropic đã nêu rõ mục tiêu lập luận ngay từ đầu. Họ không chỉ muốn chứng minh một xu hướng công nghệ, mà còn là một quá trình có định hướng và gia tốc. Để làm điều này, họ đã trình bày một bộ dữ liệu nội bộ chưa từng được công khai trước đây.

hình ảnh

Nhóm số đầu tiên chỉ ra một sự thay đổi có tính cấu trúc: tính đến tháng 5 năm 2026, hơn 80% mã được hợp nhất trong kho mã của Anthropic được Claude viết ra. Hai năm trước, con số này ở mức số đơn vị. Cùng dữ liệu này cũng cho thấy, trong quý hai năm 2026, lượng mã trung bình mà kỹ sư của Anthropic hợp nhất mỗi ngày gấp 8 lần so với năm 2024.

Bạn có thể tưởng tượng phản ứng của bất kỳ ai chưa theo dõi sâu ngành AI khi lần đầu tiên đọc hai con số này. Nhưng Anthropic tự thừa nhận trong chú thích một số điều kiện hạn chế quan trọng: ban lãnh đạo từng ước tính công khai rằng nếu tính cả các script và mã thí nghiệm, tỷ lệ mã do Claude viết vượt quá 90%, còn 80% là con số bảo thủ hơn trong thống kê mã gộp; số dòng mã “là thước đo không hoàn hảo” và có thể làm quá cao mức tăng năng suất thực tế; hệ thống gán nguồn mã “có lỗ hổng”.

Cách viết các chú thích này bản thân nó đáng để phân tích. Sự hiện diện của chúng về bề ngoài là sự nhượng bộ trung thực, nhưng thực chất lại có tác dụng khiến các con số trong phần chính trông như đã được lọc kỹ lưỡng một cách cẩn trọng, từ đó gia tăng độ tin cậy. Đây là một cấu trúc hai lớp trong kỹ thuật kể chuyện: phần chính truyền tín hiệu, chú thích đưa ra tuyên bố miễn trừ trách nhiệm.

Nhóm số thứ hai liên quan đến tốc độ. Trong nhiệm vụ tối ưu mã, Claude Opus 4 đã đạt được tốc độ tăng khoảng 3 lần vào tháng 5 năm 2025, trong khi các nhà nghiên cứu chuyên môn cần từ 4 đến 8 giờ để đạt được mức tương tự. Đến tháng 4 năm 2026, Claude Mythos Preview đã đẩy con số này lên khoảng 52 lần. Thời gian dài nhất mà AI có thể tự hoàn thành nhiệm vụ cũng tăng từ 4 phút vào tháng 3 năm 2024, gấp đôi mỗi 4 tháng, đến tháng 3 năm 2026 đạt 12 giờ. Chính tốc độ gấp đôi mỗi 4 tháng này đã tạo thành một điểm ghi nhớ dễ lan truyền, mang tính hình dung cấp số nhân.

hình ảnh

Một bộ dữ liệu khác đến từ cuộc khảo sát nội bộ năm 2026 đối với 130 nhân viên nhóm nghiên cứu Anthropic. Người trả lời trung vị ước tính sản lượng khi sử dụng Mythos Preview cao gấp khoảng 4 lần so với khi không sử dụng AI. Chú thích lại nhấn mạnh rằng các nghiên cứu độc lập trước đó của METR cho thấy các nhà phát triển có thể đã đánh giá quá cao mức tăng năng suất do AI mang lại. Cấu trúc hai lớp tương tự lại xuất hiện.

Nhóm số thứ ba cho thấy AI đang tiến gần đến ranh giới năng lực phán đoán của các nhà nghiên cứu con người. Vào tháng 11 năm 2025, Claude Opus 4.5 đã vượt trội hơn lựa chọn của các nhà nghiên cứu con người trong 51% trường hợp khi chọn hướng nghiên cứu. Đến tháng 4 năm 2026, con số này tăng lên 64%. Mẫu gồm 129 trường hợp, Anthropic ghi chú trong chú thích rằng những trường hợp này được con người chủ động lựa chọn, tại những thời điểm mà lựa chọn của con người vẫn còn không gian cải thiện.

Bất kỳ con số nào được tách riêng ra đều có thể được đưa vào các khung giải thích khác nhau. Nhưng khi đặt cùng nhau, hướng đi là nhất quán: tốc độ đang tăng lên, khoảng cách đang thu hẹp, và tất cả những điều này đang xảy ra trong chính kho mã và phòng thí nghiệm của Anthropic, chứ không phải là những suy luận lý thuyết trên các tiêu chuẩn bên ngoài.

Sau khi liệt kê các dữ liệu này, bài viết dài đưa ra ba kịch bản tương lai.

Loại đầu tiên là xu hướng đình trệ, bước vào giai đoạn nền của đường cong S. Anthropic cho biết: “Chúng tôi không tin điều này rất có khả năng xảy ra.”

Loại thứ hai là sự gia tăng hiệu quả tổng hợp, trong đó AI liên tục thay thế con người trong các giai đoạn nghiên cứu và phát triển rộng hơn, nhưng con người vẫn đặt ra hướng đi và xác định tiêu chí thành công. Anthropic đánh giá rằng “bằng chứng cho thấy chúng ta rất có thể đang tiến tới kịch bản này”.

Loại thứ ba là tự cải tiến đệ quy hoàn toàn, trong đó AI tự thiết kế, huấn luyện và triển khai các hệ thống kế nhiệm mạnh mẽ hơn chính nó, con người không còn nằm trong vòng lặp. Cách diễn đạt là “có thể”.

Thứ tự sắp xếp và cách phân bổ ngữ khí của ba tình huống này tạo thành một độ dốc kể chuyện hoàn chỉnh. Tình huống đầu tiên được xử lý nhẹ nhàng, đóng vai trò thu hút những người hoài nghi; tình huống thứ hai được neo vào “bằng chứng”, mang lại cho bài viết lớp vỏ lý tính; tình huống thứ ba thông qua cụm từ “có thể” và điều kiện “nếu xu hướng công nghệ tiếp tục”, đẩy giả định táo bạo nhất đến sát ranh giới trí tưởng tượng của người đọc, mà không cần phải gánh vác trách nhiệm chứng minh nó.

hình ảnh

Ở trung tâm sâu nhất của toàn bộ bài viết, thái độ của Anthropic được nén vào một câu: “Chúng tôi chưa đến đó, và việc tự cải tiến đệ quy cũng không phải là điều tất yếu. Nhưng nó có thể đến nhanh hơn hầu hết các tổ chức sẵn sàng.”

Từ “mong tạm dừng” đến “việc tạm dừng một phía chỉ khiến những kẻ liều lĩnh bắt kịp”

Nếu bài viết dài ngày 4 tháng 6 là một bức ảnh chụp được bố cục cẩn thận, thì khi đặt bức ảnh này vào dòng thời gian, bạn sẽ thấy được một quỹ đạo dài hơn.

Năm 2023, Anthropic đã công bố Chính sách Mở rộng Có trách nhiệm (RSP). Cam kết cốt lõi trong tài liệu chính sách này là: nếu khả năng của mô hình vượt quá khả năng kiểm soát an toàn của công ty, công ty sẽ tạm dừng đào tạo các mô hình mạnh hơn. Đây không chỉ là lời tuyên bố suông, mà là một tài liệu quản trị nội bộ có khung đánh giá và điều kiện kích hoạt. Tài liệu này từng được cộng đồng an toàn AI xem là ví dụ thực tế về “quy định tự nguyện”.

Năm 2024, CEO Dario Amodei đã đăng một bài viết lan truyền rộng rãi, đề xuất khả năng “AI mạnh mẽ” sẽ xuất hiện vào năm 2027. Lúc đó, Anthropic vẫn giữ hình ảnh độc lập theo hướng an toàn, thể hiện sự kiềm chế trước các câu chuyện về mở rộng quy mô và tăng tốc.

Ngày 26 tháng 1 năm 2026, Amodei đã đăng một bài viết dài 38 trang trên trang web cá nhân có tựa đề “The Adolescence of Technology”. Trong bài viết, ông đưa ra một phán đoán sau này được trích dẫn rộng rãi: “Vì AI hiện đang viết phần lớn mã nguồn nội bộ của Anthropic, nó đang thực sự tăng tốc tiến trình xây dựng các hệ thống AI thế hệ tiếp theo. Vòng lặp phản hồi này đang tích lũy sức mạnh từng tháng và có thể chỉ còn cách thời điểm AI thế hệ hiện tại tự xây dựng hệ thống thế hệ tiếp theo khoảng 1 đến 2 năm.” Trong cùng bài viết, ông mô tả “AI mạnh mẽ” sắp tới là “quốc gia thiên tài trong trung tâm dữ liệu”.

Đây gần như là điểm khởi đầu mà Anthropic bắt đầu hệ thống hóa việc phát đi tín hiệu rằng “vòng lặp phản hồi tự cải tiến đang diễn ra”. Và thời điểm đăng bài viết này trùng với giai đoạn công ty đang tiến từ mức định giá 350 tỷ USD lên vùng định giá cao hơn.

Chỉ chưa đầy một tháng sau, bước ngoặt đã đến.

Ngày 25 tháng 2 năm 2026, CNN đưa tin rằng Anthropic đã sửa đổi chính sách mở rộng có trách nhiệm của mình, loại bỏ cam kết cốt lõi “tạm dừng huấn luyện các mô hình mạnh hơn nếu năng lực vượt quá khả năng kiểm soát an toàn”, thay vào đó là một “lộ trình an toàn前沿” không mang tính ràng buộc. Cùng tuần đó, Bộ trưởng Quốc phòng Mỹ Pete Hegseth đã đưa ra tối hậu thư cho Dario Amodei: rút lại các đường ranh giới an toàn, hoặc mất hợp đồng 200 triệu USD của Bộ Quốc phòng.

Bài báo trích dẫn phản hồi của Jared Kaplan, Giám đốc Khoa học của Anthropic, với tạp chí Time: “Chúng tôi cho rằng việc dừng đào tạo mô hình thực sự không giúp ích cho bất kỳ ai... nếu đối thủ đang tăng tốc hết mức.” Cách diễn đạt trong phản hồi này rất đáng chú ý. “Không giúp ích cho bất kỳ ai” không phải là một lập luận kỹ thuật, mà là một cách diễn đạt về trò chơi lợi ích liên quan. Câu “nếu đối thủ đang tăng tốc hết mức” có cấu trúc kể chuyện hoàn toàn tương đồng với “việc đình chỉ đơn phương chỉ khiến những người tham gia thiếu cẩn trọng nhất bắt kịp”: nó thay thế logic đình chỉ dựa trên năng lực an toàn của chính mình bằng logic tốc độ dựa trên hành động của đối thủ.

Anthropic vẫn nhấn mạnh trong báo cáo của CNN rằng họ duy trì hai đường đỏ: không sử dụng hệ thống AI để kiểm soát hệ thống vũ khí, và không sử dụng để giám sát quy mô lớn trong nước. Điều này rất quan trọng vì nó cho thấy Anthropic không hoàn toàn từ bỏ lập trường an toàn, mà chỉ thực hiện những nhượng bộ và kiên trì có chọn lọc trên các khía cạnh an toàn khác nhau. Nhưng chính sự chọn lọc này lại là một manh mối cốt lõi trong phân tích chiến lược kể chuyện: họ nhượng bộ ở đâu, kiên trì ở đâu, ranh giới này chính là thang đo cho sự điều chỉnh lại an toàn.

Ngày 11 tháng 3, Anthropic Institute chính thức được thành lập, do Jack Clark dẫn dắt, với định vị là “tổ chức nghiên cứu vì lợi ích công cộng”. Chưa đầy hai tháng sau, vào ngày 4 tháng 5, Clark đã đăng bài viết với nội dung “60%”.

Khi chuỗi thời gian này được đặt cạnh nhau, mật độ tín hiệu và nhịp độ phát hành không phải là ngẫu nhiên. Từ việc thông báo bài viết cá nhân vào tháng 1, đến sửa đổi chính sách vào tháng 2, thành lập tổ chức vào tháng 3, dự đoán khả năng người sáng lập vào tháng 5, và cuối cùng là bài viết dài chính thức vào tháng 6, đây là một chuỗi叙事 có nhịp điệu rõ ràng và ngôn từ được nâng cấp từng bước. Không thể suy ra trực tiếp rằng “tất cả đều được lên kế hoạch từ trước”, nhưng chính chuỗi này tạo thành một câu hỏi mà nhà phân tích buộc phải đối mặt: Liệu nhịp điệu này có cho thấy Anthropic đã đưa “kể chuyện tăng tốc” vào phạm vi quản lý truyền thông công khai của mình?

Sự khiêu khích có chủ ý của Hassabis

Nếu chỉ có Anthropic điều chỉnh cách thức báo cáo trong nửa đầu năm 2026, các nhà phân tích có lý do đầy đủ để tập trung vào logic ra quyết định nội bộ của doanh nghiệp. Tuy nhiên, với việc CEO của DeepMind, Demis Hassabis, thực hiện điều chỉnh có hướng đi tương tự gần như đồng thời, lập luận về “trường hợp đơn lẻ của một doanh nghiệp” trở nên không còn vững chắc.

Ngày 20 tháng 1, Diễn đàn Davos. Hassabis vẫn duy trì phán đoán mà ông đã giữ suốt nhiều năm qua: AGI có 50% khả năng xuất hiện vào năm 2030. Ba tuần sau, vào ngày 18 tháng 2, tại Hội nghị Đỉnh cao Tác động AI ở Ấn Độ, ông nới lỏng quan điểm: “AGI có thể xuất hiện trong vòng năm năm tới.”

Từ ngày 20 đến 22 tháng 5, Google I/O. Hassabis nói trong bài phát biểu chính rằng nhân loại đang đứng ở chân núi của “điểm kỳ dị”. Trong cùng giai đoạn này, OpenAI đã ra mắt GPT-5.3-Codex, cho biết mô hình này “đã đóng vai trò then chốt trong quá trình tự tạo ra chính nó”, cụ thể bao gồm hỗ trợ gỡ lỗi quá trình huấn luyện, quản lý triển khai và phân tích kết quả đánh giá. Sự chênh lệch về nhịp độ của ba phòng thí nghiệm hàng đầu trong khung thời gian này đã được thu hẹp xuống mức tính bằng tuần.

Sau Google I/O, Hassabis đã được Axios phỏng vấn. Cuộc phỏng vấn này sau đó được trích dẫn rộng rãi, trong đó câu quan trọng nhất là ông thừa nhận việc sử dụng ngôn ngữ như “sườn đồi của điểm kỳ dị” là “có chủ đích khiêu khích”, nhằm thúc đẩy chính phủ, các nhà kinh tế học và công chúng nhận thức được tính cấp bách của sự phát triển nhanh chóng của AI. Ông cũng điều chỉnh khung thời gian cho AGI từ “không lâu sau năm 2030” thành “năm 2029 là một khả năng thực tế”, mặc dù vẫn được kỳ vọng rộng rãi là năm 2030, cộng hoặc trừ một năm.

Hassabis nói với Seoul Economic Daily một cách trực tiếp hơn: “Trong năm đến mười năm nữa, khi chúng ta nhìn lại năm 2026 và 2027, chúng ta sẽ nói: ‘Đó chính là thời điểm chúng ta bước vào kỷ nguyên AGI’.”

Cụm từ “có ý khiêu khích” đáng được suy ngẫm nhiều lần. Đó là một lời thú nhận hiếm hoi, được chính người nói tự tiết lộ về ý định kể chuyện. Nó thừa nhận rằng ít nhất một phần ngôn từ anh ta sử dụng không phải là sự phản ánh thụ động các sự thật kỹ thuật, mà là công cụ truyền thông được lựa chọn chủ động. Chính sự thú nhận này không phủ nhận khả năng anh ta thực sự đã nhìn thấy điểm đảo chiều kỹ thuật, nhưng nó rõ ràng tách biệt “câu chuyện” ra khỏi bóng tối của “sự thật”, biến nó thành một đối tượng có thể được xem xét riêng biệt.

Hassabis tự giải thích cách diễn đạt của mình, mở ra một cánh cửa phụ để hiểu tín hiệu đồng bộ hóa này. Sự “kích động có chủ ý” của ông và “lời disclaimer trong chú thích” trong lập luận dữ liệu dài của Anthropic đều thể hiện một tư thế lưỡng cư tương tự: một tay đưa ra tín hiệu đủ mạnh để gây chấn động dư luận, tay kia giữ lại không gian an toàn để lùi lại với lập luận “đây chỉ là một trong những khả năng”.

Cùng một bộ dữ liệu, hoàn toàn khác biệt về cách giải thích

Khi Anthropic và DeepMind cùng xây dựng một khung luận điểm cho rằng “AI đang tăng tốc tự tiến hóa”, các nhà nghiên cứu độc lập bên ngoài đã đưa ra những cách diễn giải thay thế đối với cùng một bộ dữ liệu và hiện tượng. Những cách diễn giải này quan trọng không phải vì một bên nào đó nắm giữ chân lý tuyệt đối, mà vì chúng phơi bày mức độ linh hoạt trong khả năng diễn giải của chính các luận điểm chính thức.

Phản hồi sắc sảo nhất đến từ Eliezer Yudkowsky. Ông không chỉ trả lời Jack Clark, mà còn tiếp tục phát biểu trong nhiều dịp sau đó. Blog của MindStudio ghi lại toàn bộ quan điểm của ông: ông so sánh thiết kế an toàn của các hệ thống AI hiện tại với lò phản ứng RBMK tại Chernobyl. Lập luận cốt lõi của phép so sánh này là nếu cần điều khiển và bộ tăng tốc được gắn vào cùng một hệ thống, thì khi bạn cố gắng giảm tốc, hệ thống thực tế sẽ càng mất kiểm soát nhanh hơn.

Nathan Lambert từ Allen Institute for AI đã đề xuất khái niệm “Tự cải tiến có tổn thất” (Lossy Self-Improvement, LSI). Luận điểm của ông trực tiếp thách thức mô hình “bánh xe tăng tốc”: khi hệ thống trở nên ngày càng phức tạp, quá trình cải tiến ở mỗi thế hệ sẽ sinh ra ma sát và tổn thất, giống như tín hiệu bị suy giảm trong quá trình truyền tải khoảng cách xa. Theo logic này, những cải tiến cho phép 80% hoặc 90% mã được AI viết ra không thể được nhân bản vô hạn sang hệ thống thế hệ tiếp theo, vì thế hệ tiếp theo sẽ đối mặt với không gian vấn đề phức tạp hơn, và tiếng ồn cũng như lỗi trong đầu ra của AI sẽ được khuếch đại qua các thế hệ.

Dean Ball, nhà nghiên cứu cấp cao của Foundation for American Innovation, đã cung cấp một khung ngôn ngữ trực tiếp hơn để giảm chiều dữ liệu của Anthropic. Ông nói với IEEE Spectrum: “Có lẽ cuối cùng họ sẽ tự động hóa thiên tài, nhưng không phải năm tới. Năm tới, họ sẽ tự động hóa lao động chân tay.” Sự phân biệt này chạm đúng vào sự mơ hồ cốt lõi của tuyên bố “80% mã được AI viết”. Nếu AI tự động hóa các mẫu cố định trong kho mã, việc tạo hàng loạt tham số, hoặc cấu hình đường ống end-to-end, thì những công việc này trong bối cảnh kỹ thuật phần mềm thực sự chỉ tương ứng với “lao động chân tay”. 20% còn lại có thể bao gồm thiết kế kiến trúc, phán đoán định hướng, và cân nhắc dựa trên thông tin không đầy đủ — những yếu tố chính là phần “thiên tài”.

David Scott Krueger từ Đại học Montreal, người sáng lập tổ chức phi lợi nhuận về an toàn AI Evitable, đề xuất ngưỡng dừng kích hoạt là “99% mã được AI viết”. Anh ấy cho IEEE Spectrum biết: “Tôi nghĩ chúng ta có thể đang vượt qua ngưỡng này ngay bây giờ.” Sự căng thẳng giữa khung lý thuyết của anh ấy và cam kết dừng lại mà Anthropic đã nới lỏng là một trong những mâu thuẫn cấu trúc quan trọng nhất trong câu chuyện này.

Jeff Clune, một nhà khoa học máy tính tại UBC, khi được phỏng vấn bởi IEEE Spectrum, lại đứng về phía đối lập. Ông nói: “Chúng ta đang ở điểm ngoặt của các hệ thống tự cải tiến đệ quy.” Nếu câu nói này được xác minh là đúng, điều đó có nghĩa là tiếng chuông cảnh báo của Yudkowsky đã được gõ đúng nhịp.

Bốn nhóm âm thanh, mỗi nhóm có hướng đi khác nhau, thậm chí ngay cả trong cùng một hướng cũng có sự xung đột nội bộ giữa các phe cực đoan. Nhưng điểm chung của chúng là đều không dựa vào khung kịch bản chính thức, mà thay vào đó, mỗi nhóm đưa ra phán đoán độc lập dựa trên phương pháp luận riêng của mình đối với cùng một nhóm hiện tượng. Chính sự đa dạng và mâu thuẫn lẫn nhau của những phán đoán này là sự phản bác mạnh mẽ nhất đối với quan điểm cho rằng “một kịch bản duy nhất đủ để bao quát toàn bộ sự thật”.

Sự kết hợp giữa đường cong định giá và nhịp điệu câu chuyện

Tháng 1 năm 2026, Anthropic hoàn tất vòng huy động vốn với định giá 350 tỷ USD. Các nhà đầu tư bao gồm Microsoft và NVIDIA. Con số này đã được một số phương tiện truyền thông chuẩn bị trước vào cuối năm 2025, nhưng thời điểm chính thức được công bố trùng với thời điểm Amodei công bố bài viết “The Adolescence of Technology”.

Tháng 2, một đợt huy động vốn khác trị giá 30 tỷ USD đã hoàn tất, định giá vẫn duy trì ở mức khoảng 350 tỷ USD. Cùng tháng đó, chính sách an ninh được sửa đổi, gỡ bỏ cam kết tạm dừng. Áp lực từ hợp đồng 200 triệu USD của Lầu Năm Góc đã được gỡ bỏ.

Tháng 5, Reuters, New York Times và TechCrunch gần như cùng lúc báo cáo rằng Anthropic đã hoàn thành một vòng huy động vốn 65 tỷ USD, định giá lên tới 965 tỷ USD. Con số này không chỉ vượt quá định giá của chính công ty hai tháng trước mà còn vượt qua mức định giá 852 tỷ USD của OpenAI vào tháng 3 năm 2026. New York Times còn trích dẫn phát biểu của Dario Amodei tại hội nghị nhà phát triển, cho biết doanh thu hàng năm của công ty đạt 30 tỷ USD, và ông thậm chí còn đùa rằng “hy vọng mức tăng trưởng doanh thu 80 lần trong năm nay sẽ không tiếp tục, vì điều đó quá điên rồ”.

Ngày 4 tháng 6, Anthropic Institute đã công bố bài viết dài "When AI builds itself".

Việc sắp xếp các mốc thời gian này theo một hàng không ngụ ý rằng có một mũi tên chính xác trên biểu đồ chỉ ra mối liên hệ. Nếu ai đó tuyên bố rằng giữa những điều này tồn tại mối quan hệ nhân quả, họ phải cung cấp bằng chứng trực tiếp. Trong absence của hồ sơ quyết định nội bộ, bất kỳ nhà phân tích nào cũng không thể và không nên đưa ra tuyên bố như vậy.

Nhưng mặt khác, việc hoàn toàn không quan sát và ghi lại mối quan hệ tương ứng giữa các mốc thời gian này cũng là không hợp lý. Một doanh nghiệp trong vòng 5 tháng đã tăng giá trị từ 350 tỷ USD lên 965 tỷ USD, tăng gần ba lần, đồng thời trải qua một sự chuyển đổi chính sách bảo mật lớn, đồng thời xây dựng một hệ thống叙事 “tín hiệu tăng tốc” do các tổ chức nghiên cứu độc lập dẫn dắt, đồng thời người đồng sáng lập của nó đưa ra dự đoán với xác suất 60%. Khi tất cả những sự kiện này được nén chặt trong vòng 6 tháng, các nhà đầu tư ít nhất có quyền đặt câu hỏi: Những tín hiệu này có và đã đóng vai trò như thế nào trong việc truyền tải thông điệp “chúng ta đang ở tiền tuyến của sự tăng tốc” đến thị trường?

Chính câu hỏi theo đuổi này mới là giá trị của sự phân tích. Câu trả lời có thể mãi mãi không chỉ có một. Nhưng một khi câu hỏi được đặt ra một cách rõ ràng, nó sẽ không bao giờ bị thu hồi một cách dễ dàng.

Năm 2026, vốn hóa thị trường trí tuệ nhân tạo toàn cầu đạt 297 tỷ USD, với năm giao dịch lớn nhất chiếm tỷ trọng đáng kể trong tổng số này. Trong bối cảnh này, mọi phòng thí nghiệm tiên tiến đều đối mặt với cùng một áp lực: bạn cần thuyết phục các nhà đầu tư rằng đường cong công nghệ của bạn sẽ dốc hơn đối thủ. Cảnh báo rủi ro của bạn cũng phải đủ lớn để khi các nhà quản lý cuối cùng bước vào để xây dựng quy định, tiếng nói của bạn đã được tích hợp sẵn vào khung chính sách. Câu chuyện của bạn còn phải đủ hấp dẫn để thu hút các nhà nghiên cứu hàng đầu chọn phòng thí nghiệm của bạn, đồng thời đủ cảnh báo để duy trì nền tảng ngôn luận còn sót lại của bạn trong cộng đồng an ninh.

Những yêu cầu này có mâu thuẫn nội tại với nhau. Việc Anthropic điều chỉnh câu chuyện trong nửa đầu năm 2026 có thể được xem như là việc hiệu chỉnh lại điểm cân bằng giữa những yêu cầu mâu thuẫn này ở cấp độ ngôn ngữ. Việc làm suy yếu cam kết về an toàn, tăng cường tín hiệu thúc đẩy, cùng với việc lặp đi lặp lại lập luận “chúng ta không thể tự mình dừng lại”, cùng tạo thành một tập hợp các vectơ hướng về cùng một hướng.

Đã gửi tín hiệu, sau đó

Cần quay lại vấn đề cốt lõi nhất: những tín hiệu này, rốt cuộc, giống như phản ánh điểm đảo chiều kỹ thuật, hay là sự nâng cấp về mặt ngôn từ nhằm hướng đến vốn và cơ quan quản lý?

Bằng chứng công khai hiện có không cho phép đơn giản chọn một trong hai lựa chọn. Bởi vì các bằng chứng được sử dụng trong hai cách giải thích thực chất là cùng một bộ dữ liệu. Tỷ lệ mã 80%, hiệu suất tăng 52 lần, thời gian nhiệm vụ doubling mỗi 4 tháng đều có thể được dùng để hỗ trợ quan điểm “điểm xoay đang đến gần”, hoặc để giải thích “chúng tôi đang truyền tải đến thị trường một nhận thức về xu hướng mà chính các kỹ thuật viên của chúng tôi đã trải nghiệm trực tiếp” — ranh giới giữa hai điều này là mờ nhạt.

Nhưng có một số sự thật là chắc chắn, không cần phải chọn bên trong hai cách giải thích.

Đầu tiên, sự chuyển đổi kịch bản mà Anthropic hoàn thành vào nửa đầu năm 2026 không phải là trường hợp đơn lẻ. Hassabis của DeepMind gần như cùng quý đã thực hiện những điều chỉnh tương tự về hướng đi, dù mức độ khác nhau nhưng bản chất giống nhau, trong khi Sam Altman của OpenAI tại hội nghị thượng đỉnh Ấn Độ nói rằng “thế giới chưa sẵn sàng” và vào tháng 2 năm 2026 đã ra mắt GPT-5.3-Codex, tuyên bố “đóng vai trò then chốt trong quá trình tạo ra chính nó”. Nếu đây chỉ là Anthropic đơn lẻ đang gửi tín hiệu, có thể phân tích từ góc độ chiến lược doanh nghiệp. Nhưng việc ba phòng thí nghiệm hàng đầu cùng tăng cường tiếng nói trong vài tháng dày đặc đã tạo thành một sự chuyển đổi kịch bản ở cấp độ ngành.

Thứ hai, nhịp độ giải phóng các tín hiệu này có mối tương ứng thời gian chính xác với nhịp độ tài trợ, điều chỉnh chính sách và tái cấu trúc tổ chức. Mối tương ứng này không cần chứng minh điều gì; nó chỉ cần được trình bày một cách trung thực. Sau khi được trình bày, phương pháp luận riêng của mỗi người sẽ quyết định họ suy nghĩ tiếp theo như thế nào.

Thứ ba, Anthropic tự gán trạng thái là “có thể xảy ra” cho kịch bản thứ ba, tức là “tự cải tiến đệ quy hoàn toàn”, chứ không phải “rất có thể xảy ra”. Điều này có nghĩa là trong khung đánh giá nội bộ của chính công ty phát hành những dữ liệu này, câu chuyện về sự tăng tốc của họ vẫn chưa được đóng lại hoàn toàn. Những lực lượng khiến họ có thói quen thêm các từ hạn chế vào các bài báo học thuật và bài viết blog vẫn đang kéo chặt dây cương trong cách họ diễn đạt công khai.

Thứ tư, lời thú nhận “cố ý khiêu khích” của Hassabis đã xác nhận một cơ chế trước đây dù bị nghi ngờ rộng rãi nhưng hiếm khi được chính các bên liên quan công khai thừa nhận: ít nhất một số nhà lãnh đạo tại các phòng thí nghiệm tiên tiến khi lựa chọn cách diễn đạt, đã mang theo mục đích truyền thông rõ ràng. Điều này khiến mọi cách diễn giải các tuyên bố của họ phải bao gồm hai cấp độ phân tích: những sự thật mà họ tuyên bố, và chính chiến lược tu từ mà họ sử dụng khi lựa chọn những tuyên bố đó như một sự kiện hành động.

Những người đọc kỹ toàn bộ dữ liệu của Anthropic và những người chỉ ghi nhớ hai con số “80% mã được AI viết” và “tăng tốc 52 lần” nhận được tín hiệu hoàn toàn khác nhau. Nhưng trong vấn đề này, “cách người ta ghi nhớ” có lẽ nên được coi là đối tượng phân tích quan trọng hơn “những gì thực sự được nói ra”.

Chính bài viết dài này là một ví dụ chính xác về hiện tượng mà nó mô tả. Nó xây dựng cảm giác gia tốc khẩn cấp thông qua dữ liệu, đồng thời giữ lại không gian lùi bằng các chú thích và từ hạn chế; nó kêu gọi sự phối hợp toàn cầu và sự giảm tốc có thể xác minh, nhưng trước đó, trong các điều chỉnh chính sách, nó đã rút lại cam kết đình chỉ. Đây không phải là sự giả dối, cũng không phải đơn thuần là sự không nhất quán giữa lời nói và hành động. Đó là một tổ chức đang thực hiện nghệ thuật cân bằng kể chuyện giữa sự không chắc chắn về công nghệ, áp lực kinh doanh và trách nhiệm công cộng. Và lời thú nhận “gây khiêu khích có chủ ý” của Hassabis đã vô tình xác nhận rằng nghệ thuật cân bằng này đã trở thành một phương pháp được sử dụng một cách có ý thức tại các phòng thí nghiệm hàng đầu.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.