Anthropic công bố các bản nâng cấp lớn cho Claude, hợp tác với SpaceX để tăng cường 300MW tính toán

Zhixidongxi ngày 7 tháng 5 đưa tin, vào đêm nay, Anthropic đã công bố nhiều tính năng lớn tại hội nghị nhà phát triển Code with Claude: nới lỏng giới hạn tốc độ gọi giao diện cho nhà phát triển, Claude Agent ra mắt ba tính năng mới, Claude Code cập nhật hơn mười tính năng mới, và đạt được hợp tác quan trọng với SpaceX.

Trước hết, kể từ hôm nay, Anthropic sẽ tăng gấp đôi hạn mức sử dụng 5 giờ của Claude Code trong các gói Pro, Max, phiên bản Nhóm và doanh nghiệp tính theo số lượng người dùng lên 10 giờ; loại bỏ giới hạn giảm hạn mức trong giờ cao điểm đối với tài khoản Pro và Max; nới lỏng giới hạn tốc độ API của mô hình Claude Opus.

SpaceXAI

Giới hạn tốc độ API sau khi cập nhật mô hình Claude Opus

Thứ hai, agent được lưu trữ trên Claude đã được bổ sung ba khả năng mới: điều phối đa agent, kết quả mục tiêu (Outcomes) và suy luận tự chủ (Dreaming). Hiện tại, Dreaming đang ở giai đoạn dùng thử nghiên cứu và cần đăng ký để trải nghiệm; Outcomes, điều phối đa agent và khả năng ghi nhớ đã được tích hợp vào dịch vụ agent được lưu trữ Managed Agents và mở cửa dùng thử công khai.

SpaceXAI

Claude Code đã bổ sung một số tính năng mới như điều khiển từ xa, làm mới giao diện người dùng, hiển thị không nhấp nháy và kiểm soát quyền hạn.

Cuối cùng, để mở rộng thêm phạm vi dịch vụ, Anthropic đã hợp tác với SpaceXAI (trước đây là xAI), sẽ sử dụng toàn bộ nguồn lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceXAI. Điều này sẽ giúp họ tăng thêm hơn 300 megawatt dung lượng tính toán trong tháng này, tương đương hơn 220.000 GPU NVIDIA, và nguồn tính toán mới này sẽ được sử dụng để nâng cao khả năng phục vụ và trải nghiệm người dùng cho các gói đăng ký Claude Pro và Claude Max.

SpaceXAI

Việc mở rộng năng lực tính toán này là một bước đi quan trọng khác trong chuỗi các biện pháp bố trí năng lực tính toán lớn mà Anthropic đã công bố.

Trước đó, Anthropic đã đạt được thỏa thuận hợp tác về năng lực tính toán lên đến 5 gigawatt với Amazon, trong đó sẽ bổ sung gần 1 gigawatt năng lực tính toán trước cuối năm 2026; ký kết thỏa thuận năng lực tính toán 5 gigawatt với Google và Broadcom, với các năng lực tính toán liên quan sẽ lần lượt đi vào hoạt động vào năm 2027; thiết lập chiến lược hợp tác với Microsoft và NVIDIA, bao gồm nguồn tài nguyên điện toán đám mây Azure trị giá 300 tỷ USD; hợp tác với Fluidstack để đầu tư 500 tỷ USD vào cơ sở hạ tầng trí tuệ nhân tạo tại Mỹ.

Vào lúc 4 giờ sáng hôm nay, Dario Amodei, đồng sáng lập và CEO của Anthropic, cùng Daniela Amodei, đồng sáng lập và chủ tịch của Anthropic, đã có cuộc đối thoại với Ami Vora, Giám đốc sản phẩm chính của Anthropic.

Dario cho biết, nhờ vào Claude, lần đầu tiên cả thế giới chú ý đến Anthropic. Tốc độ tăng trưởng ARR của Anthropic tăng theo cấp số nhân; trước đây họ từng nghĩ con số này có thể tăng dần lên 10 lần, nhưng cuối cùng lại chứng kiến mức tăng 80 lần, và họ đang cung cấp nhiều năng lực tính toán hơn bao giờ hết với tốc độ nhanh nhất có thể. Tuy nhiên, anh cũng nói rằng hy vọng đà tăng này không tiếp tục, vì quá mức bất thường và không thể nào chống đỡ nổi.

SpaceXAI

Ami Vora, Giám đốc sản phẩm của Anthropic, Daniela Amodei, đồng sáng lập Anthropic, và Dario Amodei, đồng sáng lập kiêm CEO của Anthropic (từ trái sang phải)

01. Cập nhật agent được lưu trữ trên Claude, AI học cách tự đánh giá và phát triển

Ba khả năng được nâng cấp cho tác nhân được Claude托管 bởi Anthropic lần này bao gồm:

Trước hết là khả năng sắp xếp đa tác nhân, các nhà phát triển có thể组建 cụm tác nhân để phối hợp thực hiện các nhiệm vụ cực kỳ phức tạp.

Tiếp theo là tính năng Kết quả (Outcomes), cho phép các nhà phát triển xác định chính xác tiêu chuẩn thành công của nhiệm vụ, Claude sẽ tự động lặp lại nhiều lần cho đến khi hoàn thành nhiệm vụ đạt tiêu chuẩn.

Cuối cùng là khả năng tự suy luận (Dreaming). Nhờ vào Dreaming, Claude có thể tự lập kế hoạch nhiệm vụ. Nó chủ động tổng kết lại các bản ghi hội thoại trước đó, phân tích những năng lực còn thiếu sót và bài học kinh nghiệm cần rút ra, đồng thời tự mình ghi trực tiếp những tích lũy này vào bộ nhớ.

SpaceXAI

Angela Jiang, giám đốc sản phẩm của Anthropic, và kỹ sư Katelyn Lesse, dựa trên ba tính năng mới của Claude Agent, đã tự sáng lập một công ty khởi nghiệp mang tên Lumara và phát triển phần mềm thuật toán gen cho công ty này để thực hiện việc hạ cánh tự chủ của máy bay không người lái trên Mặt Trăng.

Họ đã đặt ra một kịch bản giả định, trong đó một khách hàng muốn triển khai drone trên Mặt Trăng để khai thác một loại tài nguyên khoáng sản giả định, sau đó minh họa quy trình cấu hình cụ thể thông qua công cụ dòng lệnh Claude.

Đầu tiên, Lesse giới thiệu các tác nhân cần phối hợp thực hiện công việc: tác nhân chỉ huy tổng thể có trách nhiệm đảm bảo toàn bộ nhiệm vụ được triển khai suôn sẻ, tác nhân phát hiện chịu trách nhiệm lọc ra các địa điểm hạ cánh phù hợp chứa tài nguyên khoáng sản chất lượng cao, và tác nhân điều hướng đảm bảo máy bay không người lái hạ cánh an toàn và bay chính xác đến vị trí mục tiêu đã định.

SpaceXAI

Trong suốt quá trình thực hiện toàn bộ nhiệm vụ, tác nhân chỉ huy tổng sẽ khởi tạo một phiên nhiệm vụ, các tác nhân con sẽ đều có luồng thực thi độc lập và mỗi tác nhân đều được trang bị cửa sổ ngữ cảnh riêng.

Tiếp theo, dựa trên chức năng Kết quả (Outcomes), một tác nhân cao cấp đã được cấu hình để đảm bảo đạt được các mục tiêu đã định trước. Có thể thấy, tệp Markdown ngắn gọn dưới đây liệt kê rõ ràng các tiêu chí đánh giá thành công của nhiệm vụ: yêu cầu máy bay không người lái hạ cánh nhẹ nhàng và ổn định; phải hạ cánh trên mặt đất phẳng, không có vật cản; dự trữ đủ nhiên liệu dự phòng để đảm bảo máy bay không người lái có thể trở về Trái Đất một cách an toàn.

SpaceXAI

Để thiết lập bộ tiêu chí đánh giá này cho mục tiêu nhiệm vụ, người trình diễn gửi một sự kiện vào phiên nhiệm vụ, xác định các quy tắc đánh giá này là tiêu chí chấp nhận mục tiêu.

Ngoài ra, trong quá trình chạy nhiệm vụ, họ còn tạo riêng một tác nhân đánh giá và kiểm duyệt. Tác nhân này sẽ đánh giá liên tục trong cuộc hội thoại, xác định xem mỗi vòng thực thi có đáp ứng các tiêu chuẩn chấp nhận đã định trước hay không. Các nhà phát triển cũng có thể tự thiết lập số lần lặp lại tối đa được phép.

Tiếp theo sẽ bước vào giai đoạn thử nghiệm, khách hàng đã cung cấp dữ liệu liên quan đến sáu điểm hạ cánh giả định và sẽ chạy nhiều phiên mô phỏng để kiểm tra hiệu quả thực tế. Trên bảng điều khiển nền của Lumara, họ đã thực hiện chạy mô phỏng cho sáu điểm hạ cánh này; kết quả kiểm tra cho thấy có bốn điểm được xác định chính xác, nhưng điểm số 3 và điểm số 4 vẫn còn không gian để tối ưu hóa.

SpaceXAI

Bước tiếp theo là nâng cấp và tối ưu hệ thống này. Người trình diễn truy cập vào bảng điều khiển nhà phát triển của Claude, mở giao diện tính năng Dreaming (tự động suy diễn), nhấp vào nút có nhãn Dream, sau đó chọn một kho lưu trữ bộ nhớ. Sau đó, tác nhân tự động suy diễn sẽ phân tích lại tất cả các phiên mô phỏng trước đó và ghi lại kinh nghiệm tổng hợp vào kho bộ nhớ. Tất cả các phiên nhiệm vụ mới sau này đều có thể tham chiếu đến những kinh nghiệm đã được tích lũy này.

SpaceXAI

Quan trọng hơn, tác nhân này còn tự động tạo ra một hướng dẫn vận hành hạ cánh. Tất cả các phiên nhiệm vụ mới trong tương lai đều có thể tham chiếu theo hướng dẫn này, trong đó ghi nhận các quy tắc kinh nghiệm được tổng hợp từ các nhiệm vụ trước đó.

02. Ra mắt hơn 10 bản cập nhật, tập trung vào trải nghiệm người dùng thân thiện và trí tuệ tự chủ

Kỹ sư Claude Code Dickson Tsai đã giới thiệu hơn mười bản cập nhật của Claude Code trên hai hướng chính.

Hướng đầu tiên là về trải nghiệm của nhà phát triển: làm thế nào để các nhà phát triển cảm thấy thuận tiện và thân thiện hơn khi sử dụng Claude Code hàng ngày.

Điều khiển từ xa (Remote Control): Người dùng có thể để nhiệm vụ chạy nền trên máy tính và tiếp tục phiên làm việc cùng môi trường phát triển đó bằng điện thoại di động khi ra ngoài.

SpaceXAI

Không hiện tượng nhấp nháy: Phiên bản cũ sử dụng cách thêm nội dung vào giao diện hiện có, khiến việc lệch vị trí giao diện gây ra việc vẽ lại liên tục. Hiện tại, giao diện người dùng đầu cuối hỗ trợ chế độ toàn màn hình và sử dụng công nghệ hiển thị danh sách ảo. Nhờ tối ưu này, nó loại bỏ hiện tượng giật lag và nhấp nháy trên giao diện, cho phép các phần tử mã trong đầu cuối hỗ trợ tương tác bằng cách nhấp; ngay cả khi xử lý nhật ký phiên dài vô tận, nó vẫn duy trì mức sử dụng bộ nhớ ở mức ổn định.

Trong quá trình chạy Claude, nhà phát triển có thể xem trực quan hiệu quả hiển thị. Ngay cả với nội dung cực dài, cũng không xảy ra các vấn đề như lỗi hiển thị hoặc rối loạn.

SpaceXAI

Cập nhật giao diện người dùng: Đã thêm khả năng lọc và nhóm, cho phép quản lý theo dự án và nhiệm vụ. Các nhà phát triển còn có thể mở tự do các bảng điều khiển bằng cách kéo thả, hỗ trợ chuyển đổi linh hoạt giữa nhiều bố cục chế độ xem.

Hiện tại, các nhà phát triển có thể trực tiếp chuyển đến tóm tắt kế hoạch của từng giai đoạn, để lại ghi chú bất cứ lúc nào; tất cả các ghi chú sẽ được Claude tổng hợp và theo dõi xử lý sau này. Ngoài chế độ xem kế hoạch, các nhà phát triển còn có thể chuyển sang các chế độ xem khác và để lại ghi chú trực tiếp tại vị trí tương ứng. Cuối cùng, các nhà phát triển có thể trực tiếp mở bất kỳ tệp nào trong toàn bộ thư mục làm việc để chỉnh sửa nhanh chóng.

Khi nhật ký phiên dài, nhà phát triển có thể di chuột qua bất kỳ tin nhắn nào. Sau đó, đặt tiêu đề tùy chỉnh cho bất kỳ tin nhắn nào trong phiên, danh mục sẽ được tự động tạo ở đầu trang.

SpaceXAI

Chủ đề thứ hai là tính tự chủ thông minh (Autonomy).

Chế độ Tự động: Claude có thể tự động thực hiện các thao tác lặt vặt như yêu cầu cấp quyền, tạo nhánh, thực hiện lệnh xây dựng; Claude hiện có thể tự xử lý toàn bộ.

Claude Code đã thêm chế độ quyền: nhờ vào bộ phân loại bảo mật, AI sẽ tự động đưa ra quyết định quyền cho nhà phát triển. Bộ phân loại chủ yếu kiểm tra hai điểm: một là hành động này có mang rủi ro phá hoại hay không; hai là có đặc điểm tiêm prompt hay không. Nếu xác định việc gọi công cụ là an toàn, hệ thống sẽ tự động cho phép thực thi; nếu phát hiện rủi ro, thao tác sẽ bị chặn và chờ nhà phát triển xác nhận quyền thủ công.

Worktrees: Giúp các nhà phát triển hoàn toàn cách ly các công việc khác nhau, duy trì môi trường mã nguồn sạch sẽ và độc lập. Các cây làm việc gốc của Git có nhiều điểm bất tiện và vấn đề biên giới, Anthropic đã tối ưu và tinh chỉnh chúng, giúp các nhà phát triển có giao diện thao tác thân thiện và dễ sử dụng hơn.

SpaceXAI

Tính năng Ghi nhớ Tự động (Auto Memory): Claude có thể tích lũy kiến thức xuyên suốt các phiên, ghi nhớ các lệnh xây dựng quan trọng, kinh nghiệm gỡ lỗi, cài đặt ưu tiên dự án, v.v. Claude sẽ tự động đánh giá xem những thông tin này có hữu ích cho các cuộc trò chuyện trong tương lai hay không để quyết định có lưu trữ hay không.

SpaceXAI

Chức năng đánh giá mã đa giai đoạn, đa tác nhân: Hệ thống sẽ khởi động một nhóm tác nhân đánh giá, từng người độc lập xem xét mã từ các khía cạnh khác nhau, sau đó xác minh và kiểm tra lại tất cả các kết quả đánh giá. Cơ chế này có thể phát hiện ra nhiều vấn đề mà trước đây phải mất hàng giờ mới tìm ra.

SpaceXAI

Chức năng Routines: Tính năng này đã mở bản dùng thử, cách sử dụng: chỉ cần cấu hình một lần các prompt, kho mã nguồn và các kết nối liên quan, sau đó chọn các phương thức kích hoạt như tác vụ Cron theo lịch, thực thi hàng ngày, sự kiện GitHub Webhook,... để Claude tự động chạy.

SpaceXAI

Cập nhật gần đây cũng bao gồm hình dưới đây:

SpaceXAI

03. Xác định ba hướng phát triển tương lai, thiết kế kiến trúc phải hướng tới mô hình thế hệ tiếp theo

Dianne Penn cho biết, Anthropic đã ra mắt 18 phiên bản mô hình Claude, bao gồm Sonnet, Opus và loạt Mythos hoàn toàn mới, tất cả đều đã mở cửa cho các nhà phát triển sử dụng.

Trong suốt năm qua, họ đã lần lượt ra mắt tám mô hình lớn tiên tiến cho các nhà phát triển. Sự phát triển theo cấp số nhân của các mô hình có nghĩa là mức độ thông minh của chúng đang trở nên logic hơn, có kế hoạch hơn và suy nghĩ cẩn trọng hơn.

SpaceXAI

Các nhà phát triển trong tương lai sẽ sở hữu các tác nhân thông minh chủ động, trực tuyến 24/7, hiểu rõ phải làm gì và duy trì logic mạch lạc suốt quá trình, không bị lạc hướng. Cách mọi người sử dụng và phát triển dựa trên mô hình Claude cũng phải thay đổi theo.

Do đó, bên trong Anthropic cho rằng, khi thiết kế kiến trúc cần hướng tới mô hình thế hệ tiếp theo, chứ không chỉ đơn thuần điều chỉnh cho phiên bản hiện tại. Những nhà phát triển chiến thắng cuối cùng sẽ tối ưu hóa kiến trúc của mình từ sớm, chuẩn bị sẵn sàng cho bước nhảy vọt về khả năng trí tuệ tiếp theo, thay vì chỉ tập trung vào các cải tiến hiệu suất nhỏ hiện tại. Điều này đòi hỏi ngành công nghiệp phải liên tục xây dựng và phát triển các hệ thống đánh giá tiêu chuẩn cao hơn, dám phát triển các nguyên mẫu前沿 mà hiện tại dường như chưa thể thực hiện được.

Đối với doanh nghiệp, có hai thách thức cốt lõi chính: có thể nhận được kết quả đầu ra như kỳ vọng và đưa sản phẩm ra thị trường nhanh chóng, giao hàng nhanh chóng.

Claude nền tảng được tạo ra nhằm mục đích này, với các nguyên tố cơ sở API được tối ưu sâu cho các mô hình Claude. Nó cung cấp hạ tầng nền tảng để doanh nghiệp xây dựng và mở rộng hệ thống tác nhân, đồng thời đi kèm toàn bộ khả năng quản lý để vận hành và quản lý các hệ thống này.

Angela cho biết, vấn đề thường gặp nhất của doanh nghiệp là họ rất cần khả năng trí tuệ cao cấp nhưng lại khó triển khai và sử dụng hiệu quả. Một trong những giải pháp do Anthropic đề xuất là khả năng tư vấn chiến lược.

Doanh nghiệp chỉ cần cập nhật cấu trúc mảng công cụ trong Messages API.

Cụ thể, họ cung cấp cho doanh nghiệp một kiến trúc tác nhân, tách biệt giai đoạn thực thi và giai đoạn tư vấn ra quyết định. Khi thực hiện nhiệm vụ, doanh nghiệp có thể sử dụng các mô hình nhỏ, nhẹ, giúp giảm chi phí. Khi mô hình nhỏ cần đưa ra quyết định về bước tiếp theo, nó có thể gọi ngay lập tức các mô hình lớn hơn để nhận lời khuyên và hướng dẫn.

SpaceXAI

Trong thực tế, doanh nghiệp có thể sử dụng mô hình nhẹ để thực hiện nhiệm vụ, đồng thời để mô hình Opus cao cấp đảm vai trò cố vấn ra quyết định. Khi thử nghiệm thực tế kết hợp Sonnet làm thực thi và Opus làm cố vấn, hiệu suất tổng thể vượt xa việc chỉ sử dụng riêng mô hình Sonnet, đồng thời chi phí toàn bộ giải pháp còn thấp hơn so với việc chỉ dùng riêng Sonnet.

SpaceXAI

04. Kết luận: Anthropic đang cố gắng hết sức với ba trụ cột: mô hình, năng lực tính toán và thương mại hóa?

Cuộc cạnh tranh giữa các mô hình lớn hiện nay ngày càng gay gắt, Anthropic cũng đã tiết lộ các hướng phát triển và kế hoạch tương lai của mình:

Trước hết là khả năng phán đoán mạnh mẽ hơn và năng lực mã hóa chất lượng cao hơn, các nhà phát triển có thể để Claude xử lý các nhiệm vụ phát triển kỹ thuật tự chủ;

Thứ hai là khả năng ghi nhớ chất lượng cao, tạo ra cửa sổ ngữ cảnh dài hơn, giúp các nhà phát triển có thể liên tục thực hiện các nhiệm vụ phức tạp kéo dài và đạt được hiệu quả đầu ra tốt hơn;

Cuối cùng là khả năng hợp tác đa tác nhân, có thể组建 đội ngũ tác nhân để phối hợp làm việc, nhiều phiên bản Claude phân công nhiệm vụ xung quanh các mục tiêu phức tạp để hoàn thành các nhiệm vụ phức tạp.

Hiện nay, các doanh nghiệp mô hình lớn đang chuyển toàn diện sang cạnh tranh tổng thể về hạ tầng tính toán, mô hình, hệ sinh thái và thương mại hóa. Lần này, Anthropic không chỉ nâng cấp sản phẩm của chính mình mà còn công bố hợp tác trọng điểm với SpaceX, cộng thêm năng lực tính toán từ Amazon, Google và Microsoft, giúp tổng lượng tài nguyên tính toán của họ tiếp tục kéo dài khoảng cách so với các đối thủ cạnh tranh trong ngành. Đồng thời, cùng với việc giảm giá API và đồng thời tăng hạn mức gọi, tính cạnh tranh tổng thể của sản phẩm Anthropic ngày càng nổi bật, hứa hẹn thu hút một lượng lớn khách hàng doanh nghiệp nhỏ và vừa chuyển dịch nhanh chóng từ các nền tảng mô hình lớn khác sang hệ sinh thái Claude, củng cố thêm thị phần của họ trên thị trường AI doanh nghiệp.

Bài viết này đến từ tài khoản chính thức WeChat "Trí Động" (ID: zhidxcom), tác giả: Thành Thi, biên tập: Lý Thủy Thanh