Codex OpenAI dan Claude Code Anthropic Bertemu dalam Alat Pemrograman AI

Beberapa hari yang lalu, OpenAI secara rasmi melancarkan model besar baharu, GPT-5.4-Cyber. Seperti perasaan banyak pengguna internet, model ini juga membawa kita perasaan deja vu yang sangat kuat.

Model baru ini hampir sepenuhnya meniru Claude Mythos yang dikeluarkan Anthropic beberapa hari lalu, baik dari segi kelompok pengguna sasaran, skenario penggunaan, bahkan strategi pemasarannya. Kedudukan "bertarung rapat" ini telah mencapai tahap yang tidak lagi disembunyikan. Bahkan The New York Times dalam laporan terbarunya secara jitu menyatakan: “Seperti Anthropic, OpenAI…”

Claude Code

Tren homogenisasi ini tidak sekadar berhenti pada model dasar paling bawah. Jika anda memperhatikan rangkaian produk terbaru yang dikeluarkan oleh kedua syarikat ini, anda akan mendapati mereka sedang menjadi cermin satu sama lain!

Di bawah lampu tanpa bayangan pasaran modal, konvergensi ini menjadi lebih jelas. Saat ini, penilaian kedua syarikat di pasaran sekunder sangat rapat, bahkan Anthropic baru-baru ini mengalami kenaikan harga sedikit lebih tinggi daripada OpenAI berikutan kemajuan pesatnya di pasaran perniagaan. Bau modal paling peka; dalam pandangan mereka, dua unicorn ini sedang tumbuh tanduk yang sama.

Claude Code

Kelihatan bahawa homogenisasi model dasar pasti akan menyebabkan konvergensi aplikasi lapisan atas.

Hari ini, saya ingin membincangkan dua alat rujukan yang mewakili tahap tertinggi pengaturcaraan berasaskan AI semasa ini: Codex daripada OpenAI dan Claude Code daripada Anthropic. Dari perjalanan yang dahulu berbeza, kini mereka berakhir di tempat yang sama—bagaimanakah mereka berubah menjadi serupa?

Dari Berpisah Jalan ke Tujuan yang Sama: Sejarah Perkembangan Dua Raksasa

Kembalikan masa beberapa tahun yang lalu, Codex dan Claude Code adalah hasil daripada falsafah teknologi yang berbeza sepenuhnya.

Logik asas Codex ialah "Dalam seni bela diri, kecepatan adalah segalanya." Ia seperti seorang pembangun senior dengan pengalaman 5 tahun yang mengikuti di belakang anda dan sedia membantu melengkapkan kod.

Claude Code

Dalam konsep OpenAI, Codex ialah agen terminal ringan dan interaktif tinggi yang menekankan iterasi pantas dan pengaturan interaktif. Ia mempunyai kelajuan pelaksanaan yang sangat pantas, mampu mencapai throughput 1000 token per saat dengan sokongan peranti Cerebras WSE-3. Dalam alur kerja yang spesifik, Codex menyediakan tiga mod pengesahan yang jelas—cadangan, suntingan automatik, dan automatik penuh—supaya pembangun sentiasa berada dalam lingkaran tersebut. Reka bentuk ini sangat sesuai dengan pembangun geeks yang memerlukan pembinaan prototaip pantas dan pengurusan interaksi frekuensi tinggi.

Sebaliknya, Claude Code membawa sifat "arkitek" yang dingin dan terkawal sejak dilahirkan.

Claude Code

Anthropic telah menyuntikkan gen untuk menangani tugas-tugas ekstrem kompleks. Ia bergantung pada jendela konteks besar hingga 1 juta token, serta teknik "kompresi" unik untuk mencapai perbualan tanpa henti. Prinsip Claude Code ialah "kuasa keseluruhan, bertindak selepas perancangan teliti". Sebelum melaksanakan sebarang tindakan, ia terlebih dahulu menggunakan teknik carian agen untuk memahami seluruh struktur kod, kemudian mengkoordinasikan modifikasi konsisten antara banyak fail. Bagi tugas reka semula perniagaan yang melibatkan pemindahan puluhan ribu baris kod, Claude Code menunjukkan kekuasaan yang menakjubkan.

Namun, seiring berlalunya masa dan penerapan skenario yang terus menurun, dua alat yang sebelumnya sangat berbeza sifatnya mulai saling meniru.

Claude Code

Sumber gambar: MorphLLM

Semasa menangani projek yang kompleks, batasan utama yang dihadapi model AI monolitik ialah pencemaran konteks. Apabila anda meminta AI untuk membina semula modul pengesahan, ia sering kali melupakan corak reka bentuk fail pertama selepas membaca 40 fail. Untuk menyelesaikan masalah ini, dua syarikat memberikan jawapan yang hampir sama: menetapkan tetingkap konteks yang berasingan untuk setiap tugas sub.

OpenAI akan segera melancarkan aplikasi desktop macOS baru yang mengasingkan tugas mengikut projek dalam benang yang berbeza dan menjalankannya secara berasingan dalam sandbox awan. Anthropic pula melancarkan arsitektur pasukan agen, yang membenarkan pembangun menghasilkan beberapa agen anak yang berkongsi senarai tugas dan ketergantungan, serta bekerja secara selari dalam tetingkap berasingan masing-masing. Anda akan mendapati, sama ada ia dipanggil «sandbox awan» atau «pasukan agen», konsep inti dalam pelaksanaan kejuruteraan mereka telah sepenuhnya bersatu.

Dalam skor ujian rujukan, ia juga menunjukkan keseimbangan halus. GPT-5.3-Codex memimpin dengan skor 77.3% dalam tugas Terminal-Bench 2.0. Claude Code pula mencapai 80.8% dalam senarai SWE-bench Verified yang kompleks. Keduanya telah mencapai puncak dalam kekuatan masing-masing, sambil berusaha keras memperbaiki kelemahan mereka.

Efek OpenClaw: Tangan tak kasat mata yang meruntuhkan tembok tinggi

Jika strategi dalaman dua syarikat menentukan faktor dalaman mereka menuju homogenisasi, maka tekanan dari ekosistem sumber terbuka keseluruhan merupakan kekuatan luar yang tidak boleh diabaikan. Di sini, kita perlu menyebut kesan mendalam yang dibawa oleh OpenClaw kepada keseluruhan laluan alat pengaturcaraan AI.

Sebagai kerangka kerja alur kerja yang dilancarkan oleh komuniti sumber terbuka, kehadiran OpenClaw boleh dikatakan meruntuhkan tembok ekosistem yang susah payah dibina oleh raksasa-raksasa. Ia telah memperstandardisasi proses interaksi antara model besar dan rantai alat terminal tempatan. Dahulu, bagaimana untuk membolehkan model besar memanggil penghantaran Git tempatan dengan elegan, bagaimana untuk menjalankan skrip ujian dengan selamat dalam persekitaran sandbox, dan bagaimana untuk melakukan pengesahan推理 berperingkat, semuanya merupakan "teknologi eksklusif" yang menjadi kebanggaan Codex dan Claude Code.

Namun, OpenClaw telah mengabstrakkan proses-proses ini menjadi protokol universal. Ini bermakna, pembangun tidak lagi perlu terikat pada platform tertentu demi satu corak kerjasama tertentu. Kegembiraan komuniti sumber terbuka menjadikan standardisasi sebagai arus besar yang tidak boleh dibalikkan. Menghadapi situasi ini, sama ada OpenAI atau Anthropic, semuanya terpaksa menurunkan sikap mereka untuk kompatibel dengan standard terbuka ini.

Apabila rintangan teknikal asas diratakan oleh kekuatan sumber terbuka seperti OpenClaw, dan semua ciri canggih menjadi peralatan piawai industri, satu-satunya jalan keluar bagi Codex dan Claude Code ialah bersaing tanpa henti dalam aspek pengalaman pengguna yang lebih halus. Inilah sebabnya kita merasakan mereka semakin serupa, kerana dalam kerangka piawai, penyelesaian terbaik seringkali hanya satu — seperti evolusi konvergen dalam biologi.

Codex sedang mengejar Claude Code

Walaupun Claude Code dan Codex sedang bergerak menuju evolusi yang konvergen, perbezaan antara keduanya masih wujud, dan Codex bahkan telah lebih disukai oleh pembangun dalam beberapa aspek.

Dua hari yang lalu, di komunitas r/ClaudeCode, seorang jurutera tingkat tinggi dengan pengalaman 14 tahun yang pernah bekerja di syarikat teknologi besar, u/Canamerican726, berkongsi satu ulasan yang sangat mendalam.

Secara khusus, dalam projek kompleks yang mengandungi 80,000 baris kod, beliau menghabiskan 100 jam menggunakan Claude Code dan 20 jam menggunakan Codex.

Claude Code

Dalam perspektifnya, menggunakan Claude Code seperti membimbing seorang jurutera yang sedang dikejar oleh tarikh akhir—ia bergerak sangat pantas, tetapi sering mengabaikan spesifikasi yang ditulis oleh pengembang dalam CLAUDE.md, serta suka menambahkan kod secara berterusan dalam fail yang sedia ada untuk menyelesaikan tugas, tanpa mempunyai pemikiran reka semula.

Sebaliknya, Codex memberinya kesan seperti seorang pakar berpengalaman 5 hingga 6 tahun. Walaupun kelajuan pemprosesannya lebih perlahan 3 hingga 4 kali ganda, ia akan berhenti secara aktif semasa proses untuk memikirkan dan menyemula struktur kod, serta mematuhi sempadan arahan dengan ketat. Autonomi yang tinggi ini membolehkan jurutera itu memberikan tugas secara langsung kepadanya dan bersantai sambil melakukan perkara lain.

Suara yang sama juga muncul di rangkaian sosial seperti X. Penyelidik Aran Komatsuzaki, berdasarkan pengalaman penggunaannya, menyatakan bahawa Claude Code masih unggul dalam bidang antara muka, tetapi Codex yang sering memanggil carian web jelas lebih kukuh dalam perancangan belakang dan mempertahankan maklumat terkini.

Claude Code

Komen-komen dipenuhi dengan ringkasan berdasarkan skenario perniagaan sebenar. Seorang pembangun dengan tajam menunjukkan bahawa model berdasarkan Opus walaupun berjalan pantas, sering kali mengakumulasi banyak "hutang pembersihan kod" kepada projek, manakala Codex bergerak perlahan tetapi boleh membersihkan lantai sambil bergerak maju. Saya bahkan melihat pengguna merumuskan satu peraturan kehidupan, mencadangkan agar semua orang segera mula sesi baru apabila penggunaan jendela konteks mencapai 70%, kerana sangat mudah menerima bug tersembunyi yang diberikan oleh sistem.

Claude Code

Keluhan sebenar dari garis depan ini dengan jelas menunjukkan bahawa apabila panel kemampuan dua alat utama semakin bertindih, keputusan setia pengembang sering kali ditentukan oleh perbezaan pengalaman halus yang berkaitan dengan "kos mengisi lubang" dan "keperluan mental", dan tentu saja, pengguna China menghadapi beberapa kesukaran khas, seperti:

Claude Code

Pemikiran sejuk: Perang ekosistem di sebalik homogenisasi

Tentu, kelebihan dan kekurangan Codex dan Claude Code bergantung pada masing-masing pembangun, serta kemampuan pembangun itu sendiri, seperti yang disimpulkan dalam laporan ulasan u/Canamerican726 di atas: jika anda tidak memahami kejuruteraan perisian, kedua-dua alat ini akan menghasilkan output yang buruk; alat bukanlah pengganti kemahiran.

Perkataan ini menghancurkan ilusi yang telah lama dicipta oleh alat pengaturcaraan AI. Kami pernah percaya bahawa dengan adanya pembantu AI yang cukup kuat, seorang Vobe Coder tanpa asas pun boleh membina aplikasi perniagaan secara berseorangan. Tetapi kenyataannya, Claude Code memerlukan seorang 'pemandu' yang sangat fokus dan mahir, jika tidak ia akan mudah tersesat dalam kodbas yang besar. Codex walaupun lebih berdiri sendiri, ia masih memerlukan pembangun memberikan konteks sistem yang tepat agar dapat mencapai kecekapan maksimum.

Jadi, pada masa kini di mana kemampuan alat sangat homogen, di manakah parit perlindungan kedua syarikat ini berpindah?

Jawapannya tersembunyi dalam laporan kewangan yang membosankan dan strategi penentuan harga. Dalam tugas yang sama, jumlah token yang digunakan oleh Claude Code seringkali 3 hingga 4 kali ganda berbanding Codex. Kos penggunaan lebih tinggi. Untuk pasukan perniagaan, penggunaan Claude Code memerlukan bayaran antara $100 hingga $200 sebulan bagi setiap pembangun. Manakala Codex membungkus kemampuannya ke dalam pelan langganan yang lebih mesra kocek, serta mengumpulkan banyak pengguna asas melalui komuniti GitHub yang besar.

Claude Code

Sumber gambar: MorphLLM

Ambisi Anthropic adalah untuk mengintegrasikan Claude Code secara mendalam ke dalam alur kerja raksasa teknologi yang tidak kekurangan dana. Sebagai contoh, Stripe membolehkan 1.370 jurutera menggunakan Claude Code untuk menyelesaikan migrasi kod lintas bahasa yang sebelumnya memerlukan 10 orang bekerja selama beberapa minggu dalam masa hanya 4 hari. Syarikat Ramp pula bergantung padanya untuk mengurangkan masa respons peristiwa sebanyak 80%. OpenAI pula bergantung pada渗透asi ekosistemnya yang meluas, menjadikan Codex sebagai pilihan lalai bagi banyak pengembang biasa.

Ini bukan lagi sekadar pertandingan teknikal, tetapi sebuah peperangan habis-habisan mengenai pengikatan ekosistem, strategi penetapan harga, dan pembentukan semula kebiasaan pengguna.

Persimpangan Pembangun

Mengingat perkembangan teknologi sepanjang tahun ini, pelancaran GPT-5.4-Cyber hanyalah satu catatan kecil dalam perjuangan panjang ini. Codex dan Claude Code sedang menuju "wajah yang sama", menandakan bahawa alat pengaturan AI telah beralih dari peringkat ujian awal yang penuh ketidakpastian dan keanehan kepada peringkat penghasilan industri yang matang dan membosankan.

Sekarang, Claude Code menghasilkan 135,000 commit GitHub setiap hari, yang telah mewakili 4% daripada jumlah commit awam di seluruh rangkaian. Kita boleh meramalkan bahawa dalam masa yang tidak lama lagi, sebahagian besar kod contoh, kes ujian asas, dan pemulihan kod biasa akan dilakukan secara senyap oleh agen AI yang semakin serupa ini di latar belakang.

Claude Code

Sumber gambar: MorphLLM & SemiAnalysis / GitHub Search API

Menghadapi dua alat super yang kemampuannya hampir tak terbatas dan pengalaman satu sama lain saling meniru, apakah nilai inti kita sebagai pembangun manusia masih tersisa? Mungkin masa keuntungan alat akan segera berakhir sepenuhnya. Ketika setiap orang memegang senjata yang sama tajamnya, yang menentukan kemenangan bukan lagi siapa yang memiliki kecepatan pelengkapan kod lebih baik, tetapi siapa yang mampu mendefinisikan masalah dengan lebih baik, siapa yang memiliki visi arsitektur sistem yang lebih luas, serta siapa yang mampu menemukan keunikan manusia yang tak tergantikan di dunia kod yang dipenuhi AI.

Ngomong-ngomong, kamu pilih yang mana?

Pautan rujukan

https://www.morphllm.com/comparisons/codex-vs-claude-code

https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/

https://x.com/arankomatsuzaki/status/2044270102003196007

https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html

Artikel ini berasal daripada akaun微信公众号 "Machine Heart" (ID: almosthuman2014), penulis: Machine Heart