Vài ngày trước, OpenAI chính thức ra mắt mô hình lớn mới GPT-5.4-Cyber. Cũng như nhiều người dùng mạng cảm nhận, mô hình này cũng mang đến cho chúng ta một cảm giác quen thuộc cực kỳ mạnh mẽ.
Mô hình mới này gần như hoàn toàn nhắm đúng vào đối tượng người dùng mục tiêu, bối cảnh ứng dụng và thậm chí cả chiến lược truyền thông so với Claude Mythos mà Anthropic vừa ra mắt vài ngày trước. Tình thế “đụng độ trực tiếp” này đã trở nên không còn giấu giếm chút nào. Ngay cả The New York Times cũng đã chỉ ra một cách sắc sảo trong tiêu đề bài báo mới nhất của mình: “Giống như Anthropic, OpenAI...”

Xu hướng đồng nhất này không chỉ dừng lại ở cấp độ mô hình nền tảng cơ bản nhất. Nếu bạn quan sát các sản phẩm mới được hai công ty này ra mắt gần đây, bạn sẽ thấy chúng đang trở thành bản sao của nhau!
Dưới ánh đèn không bóng của thị trường vốn, sự hội tụ này trở nên rõ ràng hơn bao giờ hết. Hiện tại, định giá của hai công ty trên thị trường thứ cấp rất sát sao, thậm chí Anthropic gần đây còn có giá cao hơn một chút so với OpenAI nhờ sự bứt phá mạnh mẽ của họ trên thị trường doanh nghiệp. Khứu giác của vốn luôn nhạy bén nhất; trong mắt họ, hai con kỳ lân này đang mọc ra những sừng giống hệt nhau.

Dường như sự đồng nhất của các mô hình nền tảng chắc chắn sẽ dẫn đến sự hội tụ của các ứng dụng cấp trên.
Hôm nay, tôi muốn cùng mọi người thảo luận về hai công cụ tiêu biểu đại diện cho trình độ cao nhất hiện nay trong lập trình hỗ trợ bởi AI: Codex của OpenAI và Claude Code của Anthropic. Từ việc từng đi theo hai con đường khác nhau, đến nay lại cùng hướng đến một đích đến, chúng đã từng bước trở nên giống nhau như thế nào?
Từ chia tay đến hội tụ: Hành trình phát triển của hai cường quốc
Hãy quay ngược thời gian về vài năm trước, Codex và Claude Code hoàn toàn là sản phẩm của hai triết lý công nghệ khác nhau.
Logic nền tảng của Codex là “trong võ công thiên hạ, nhanh là vô địch”. Nó giống như một lập trình viên cấp cao có 5 năm kinh nghiệm, luôn ở phía sau bạn và sẵn sàng hoàn thiện mã nguồn.

Trong ý tưởng của OpenAI, Codex là một tác nhân terminal nhẹ, tương tác cao, tập trung vào việc lặp lại nhanh và lập trình tương tác. Tốc độ thực thi của nó cực kỳ nhanh, nhờ vào phần cứng Cerebras WSE-3, có thể đạt throughput lên đến 1.000 token mỗi giây. Trong quy trình làm việc cụ thể, Codex cung cấp ba chế độ phê duyệt rõ ràng: đề xuất, chỉnh sửa tự động và tự động hoàn toàn, giúp các nhà phát triển luôn nằm trong vòng lặp. Thiết kế này rất phù hợp với các nhà phát triển đam mê cần xây dựng bản mẫu nhanh và xử lý tương tác tần suất cao.
Ngược lại, Claude Code ngay từ khi ra đời đã mang sẵn một thuộc tính "kiến trúc sư" lạnh lùng và kiềm chế.

Anthropic đã truyền cho nó gen xử lý các nhiệm vụ cực kỳ phức tạp. Nó dựa vào cửa sổ ngữ cảnh khổng lồ lên đến 1 triệu token và công nghệ “nén” độc đáo để đạt được hội thoại vô hạn. Nguyên tắc của Claude Code là “nắm toàn cục, tính toán kỹ rồi hành động”. Trước khi thực hiện bất kỳ hành động nào, nó sẽ sử dụng công nghệ tìm kiếm tác nhân để hiểu rõ toàn bộ cấu trúc mã nguồn, sau đó phối hợp chỉnh sửa nhiều tệp một cách nhất quán. Đối với các nhiệm vụ tái cấu trúc doanh nghiệp liên quan đến hàng chục nghìn dòng mã, Claude Code đã thể hiện sức mạnh vượt trội.
Tuy nhiên, theo thời gian và sự mở rộng ngày càng sâu rộng của các ứng dụng thực tế, hai công cụ vốn có tính cách hoàn toàn khác biệt này bắt đầu học theo nhau.

Nguồn hình ảnh: MorphLLM
Khi xử lý các dự án phức tạp, rào cản lớn nhất mà mô hình AI đơn lẻ phải đối mặt là ô nhiễm ngữ cảnh. Khi bạn yêu cầu AI tái cấu trúc mô-đun xác thực, sau khi đọc 40 tệp, nó thường đã quên mô hình thiết kế của tệp đầu tiên. Để giải quyết điểm đau này, hai công ty đã đưa ra câu trả lời gần như giống hệt nhau: gán cửa sổ ngữ cảnh độc lập cho từng nhiệm vụ con.
OpenAI sắp ra mắt ứng dụng桌面 hoàn toàn mới cho macOS, tách các nhiệm vụ vào các luồng khác nhau theo dự án và chạy độc lập trong sandbox trên đám mây. Anthropic đã ra mắt kiến trúc đội ngũ tác nhân, cho phép các nhà phát triển tạo ra nhiều tác nhân con, chia sẻ danh sách nhiệm vụ và phụ thuộc, đồng thời làm việc song song trong các cửa sổ riêng biệt. Bạn sẽ nhận thấy rằng, dù gọi là “sandbox trên đám mây” hay “đội ngũ tác nhân”, thì về mặt thực hiện kỹ thuật, chúng đã hoàn toàn trùng hợp về ý tưởng cốt lõi.
Trên bảng điểm đánh giá, chúng cũng thể hiện một sự cân bằng tinh tế. GPT-5.3-Codex dẫn đầu với điểm số 77,3% trong nhiệm vụ Terminal-Bench 2.0. Trong khi đó, Claude Code đạt 80,8% trên bảng xếp hạng SWE-bench Verified phức tạp. Chúng đều đạt đến mức tối đa trong lĩnh vực thế mạnh của mình, đồng thời nỗ lực không ngừng để bù đắp những điểm yếu của bản thân.
Hiệu ứng OpenClaw: Bàn tay vô hình xóa bỏ những bức tường cao
Nếu chiến lược nội bộ của hai công ty quyết định xu hướng đồng nhất hóa bên trong, thì áp lực từ toàn bộ hệ sinh thái mã nguồn mở là lực lượng bên ngoài không thể bỏ qua. Tại đây, chúng ta phải nhắc đến ảnh hưởng sâu rộng mà OpenClaw mang lại cho toàn bộ lĩnh vực công cụ lập trình AI.
Là một khung công tác do cộng đồng mã nguồn mở phát triển, sự ra đời của OpenClaw có thể nói đã phá vỡ những bức tường sinh thái mà các ông lớn đã dày công xây dựng. Nó đã chuẩn hóa quy trình tương tác giữa mô hình lớn và chuỗi công cụ đầu cuối cục bộ. Trước đây, việc làm thế nào để mô hình lớn gọi một cách tinh tế các cam kết Git cục bộ, chạy an toàn các kịch bản kiểm thử trong môi trường cách ly, hay thực hiện xác minh suy luận đa bước — đều là những “công nghệ độc quyền” mà Codex và Claude Code từng tự hào.
Nhưng OpenClaw đã trừu tượng hóa các quy trình này thành một giao thức chung. Điều này có nghĩa là các nhà phát triển không còn bị ràng buộc vào một nền tảng cụ thể để phục vụ một mô hình hợp tác đặc biệt nào. Sự phấn khích từ cộng đồng mã nguồn mở đã biến tiêu chuẩn hóa thành một làn sóng không thể đảo ngược. Trước tình hình này, cả OpenAI lẫn Anthropic đều buộc phải hạ thấp tư thế để tương thích với tiêu chuẩn mở này.
Khi rào cản công nghệ nền tảng bị lực lượng mã nguồn mở như OpenClaw xóa bỏ, và mọi tính năng cao cấp đều trở thành tiêu chuẩn ngành, thì con đường duy nhất của Codex và Claude Code là lao vào cuộc cạnh tranh vô tận ở cấp độ trải nghiệm người dùng tinh vi hơn. Đó cũng là lý do tại sao chúng ta cảm thấy chúng ngày càng giống nhau — bởi trong khuôn khổ chuẩn hóa, giải pháp tối ưu thường chỉ có một — giống như sự tiến hóa hội tụ trong sinh học.
Codex đang đuổi theo Claude Code
Mặc dù Claude Code và Codex đang tiến dần đến sự phát triển đồng nhất, nhưng sự khác biệt giữa hai bên vẫn tồn tại, thậm chí Codex đã được các nhà phát triển ưa chuộng hơn ở một số khía cạnh.
Hai ngày trước, trong cộng đồng r/ClaudeCode, một kỹ sư cấp cao với 14 năm kinh nghiệm từng làm việc tại các tập đoàn công nghệ lớn u/Canamerican726 đã chia sẻ một bài đánh giá cực kỳ chuyên sâu.
Cụ thể, anh ấy đã dành 100 giờ sử dụng Claude Code và 20 giờ sử dụng Codex trong một dự án phức tạp gồm 80.000 dòng mã.

Trong góc nhìn của anh ấy, việc sử dụng Claude Code giống như hướng dẫn một kỹ sư đang bị áp lực bởi thời hạn, nó chạy cực nhanh nhưng thường bỏ qua các quy định được ghi trong CLAUDE.md, đồng thời thích liên tục tích lũy mã trong các tệp hiện có để hoàn thành nhiệm vụ, thiếu tư duy tái cấu trúc.
So sánh với điều đó, Codex mang đến cho anh cảm giác như một chuyên gia dày dạn với 5 đến 6 năm kinh nghiệm. Mặc dù tốc độ xử lý chậm hơn 3 đến 4 lần, nhưng nó sẽ chủ động dừng lại giữa chừng để suy nghĩ và tái cấu trúc mã, đồng thời tuân thủ nghiêm ngặt các ranh giới lệnh. Sự tự chủ cao độ này khiến kỹ sư này dám giao nhiệm vụ trực tiếp cho nó và yên tâm làm việc khác.
Cùng một giọng điệu cũng xuất hiện trên các mạng xã hội như X. Nhà nghiên cứu Aran Komatsuzaki dựa trên trải nghiệm sử dụng của mình cho biết, trong lĩnh vực frontend, Claude Code vẫn chiếm ưu thế, nhưng trong lập kế hoạch backend và duy trì thông tin cập nhật, Codex với tần suất gọi tìm kiếm mạng cao rõ ràng vững chắc hơn.

Phần bình luận tràn ngập những bài học đắt giá từ các tình huống thực tế. Có nhà phát triển chỉ ra một cách sắc sảo rằng, các mô hình dựa trên Opus dù chạy nhanh, nhưng thường tích lũy cho dự án một lượng lớn "nợ vệ sinh mã nguồn", trong khi Codex hành động chậm hơn nhưng đồng thời có thể dọn dẹp sạch sẽ đường đi. Tôi thậm chí còn thấy một người dùng tổng kết ra một quy luật sinh tồn, khuyên mọi người nên khởi tạo phiên mới ngay khi mức sử dụng cửa sổ ngữ cảnh đạt 70%, nếu không sẽ rất dễ nhận được các lỗi ẩn được hệ thống "tặng kèm".

Những phản hồi chân thực từ thực tế này cho thấy rõ ràng, khi các tính năng của hai công cụ hàng đầu ngày càng trở nên trùng lặp, thì quyết định cuối cùng về sự lựa chọn của nhà phát triển thường là những khoảng cách nhỏ về trải nghiệm liên quan đến “chi phí lấp đầy hố” và “chi phí tâm lý duy trì”, tất nhiên đối với người dùng Trung Quốc còn có một số khó khăn đặc biệt, chẳng hạn như:

Suy nghĩ lạnh: Cuộc chiến sinh thái đằng sau sự đồng nhất
Tất nhiên, ưu nhược điểm của Codex và Claude Code còn phụ thuộc vào chính các nhà phát triển, cũng như năng lực của từng người, như kết luận trong bài đánh giá của u/Canamerican726 nêu trên: Nếu bạn không hiểu về kỹ thuật phần mềm, cả hai công cụ này đều sẽ tạo ra kết quả kém, công cụ không đồng nghĩa với kỹ năng.
Câu này đã phá vỡ ảo tưởng lâu nay mà các công cụ lập trình AI tạo ra. Chúng ta từng tin rằng, chỉ cần có một trợ lý AI mạnh mẽ, ngay cả những Vobe Coder không có nền tảng cũng có thể một mình xây dựng các ứng dụng doanh nghiệp. Nhưng thực tế là, Claude Code cần một “người lái” cực kỳ tập trung và có kỹ năng vững vàng, nếu không nó rất dễ bị lạc hướng trong kho mã nguồn khổng lồ. Codex dù độc lập hơn, nhưng nó cũng cần các nhà phát triển cung cấp ngữ cảnh hệ thống chính xác để phát huy tối đa hiệu quả.
Vậy thì, trong bối cảnh năng lực công cụ ngày càng đồng nhất như hiện nay, lợi thế cạnh tranh của hai công ty này đã chuyển đến đâu?
Câu trả lời nằm trong những báo cáo tài chính và chiến lược định giá nhàm chán. Trong cùng một nhiệm vụ, số lượng token mà Claude Code tiêu thụ thường gấp 3 đến 4 lần so với Codex, dẫn đến chi phí sử dụng cao hơn. Đối với các đội ngũ doanh nghiệp, việc sử dụng Claude Code đòi hỏi chi trả từ 100 đến 200 USD mỗi tháng cho mỗi nhà phát triển. Trong khi đó, Codex đã đóng gói khả năng của mình vào các kế hoạch đăng ký có giá cả phải chăng hơn, đồng thời tích lũy được một lượng lớn người dùng cơ sở thông qua cộng đồng GitHub rộng lớn.

Nguồn hình ảnh: MorphLLM
Mục tiêu của Anthropic là tích hợp sâu Claude Code vào quy trình làm việc của những tập đoàn công nghệ không thiếu tiền. Ví dụ, Stripe đã cho 1.370 kỹ sư sử dụng Claude Code để hoàn thành một nhiệm vụ di chuyển mã đa ngôn ngữ vốn cần 10 người làm trong vài tuần, chỉ trong 4 ngày. Công ty Ramp thậm chí còn dựa vào nó để giảm 80% thời gian phản hồi sự cố. OpenAI thì dựa vào mức độ thâm nhập rộng rãi vào hệ sinh thái của mình, biến Codex thành lựa chọn mặc định của nhiều nhà phát triển thông thường.
Đây không còn là một cuộc cạnh tranh thuần túy về công nghệ, mà là một cuộc chiến tiêu hao về việc gắn kết hệ sinh thái, chiến lược định giá và thay đổi thói quen người dùng.
Ngã tư của nhà phát triển
Nhìn lại sự phát triển công nghệ trong năm qua, việc ra mắt GPT-5.4-Cyber chỉ là một ghi chú nhỏ trong cuộc chiến dài hạn này. Codex và Claude Code đang tiến tới “một khuôn mặt duy nhất”, đánh dấu sự chuyển đổi của các công cụ lập trình AI từ giai đoạn thử nghiệm đầy biến động và kỳ lạ sang giai đoạn sản xuất công nghiệp chín muồi và nhàm chán.
Hiện nay, Claude Code tự động tạo ra 135.000 lần cam kết GitHub mỗi ngày, con số này đã chiếm 4% tổng số cam kết công khai trên toàn mạng. Chúng ta có thể dự đoán rằng, trong tương lai gần, phần lớn mã mẫu, các trường hợp kiểm tra cơ bản và các đợt tái cấu trúc mã thông thường sẽ được các thực thể AI ngày càng giống nhau này thực hiện âm thầm ở nền sau.

Nguồn hình ảnh: MorphLLM & SemiAnalysis / GitHub Search API
Trước hai công cụ siêu việt có năng lực gần như vô hạn và trải nghiệm bắt chước lẫn nhau, giá trị cốt lõi của chúng ta – những nhà phát triển con người – còn lại là gì? Có lẽ giai đoạn lợi nhuận từ công cụ sắp kết thúc hoàn toàn. Khi mỗi người đều cầm trên tay những vũ khí sắc bén như nhau, điều quyết định thắng bại sẽ không còn là ai có tốc độ hoàn thành mã tốt hơn, mà là ai có thể định nghĩa vấn đề tốt hơn, ai sở hữu tầm nhìn kiến trúc hệ thống rộng lớn hơn, và ai có thể tìm ra sự không thể thay thế mang tính con người trong thế giới mã bị AI lấp đầy này.
Nói lại thì, bạn chọn cái nào?
Liên kết tham khảo
https://www.morphllm.com/comparisons/codex-vs-claude-code
https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/
https://x.com/arankomatsuzaki/status/2044270102003196007
https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html
Bài viết này đến từ tài khoản WeChat "Machine Heart" (ID: almosthuman2014), tác giả: Machine Heart
