Beberapa hari yang lalu, OpenAI secara resmi meluncurkan model besar baru, GPT-5.4-Cyber. Seperti banyak pengguna internet, model ini juga memberi kita感覚 yang sangat kuat.
Model baru ini hampir sepenuhnya meniru Claude Mythos yang dirilis Anthropic beberapa hari lalu, baik dalam kelompok pengguna target, skenario aplikasi, bahkan strategi pemasarannya. Kondisi "bertarung langsung" ini telah mencapai tingkat yang tidak lagi disembunyikan. Bahkan The New York Times dalam judul laporan terbarunya secara tajam menyatakan: "Seperti Anthropic, OpenAI..."

Tren homogenisasi ini sama sekali tidak terbatas pada model dasar paling bawah. Jika Anda melihat rangkaian produk terbaru yang dirilis oleh kedua perusahaan ini, Anda akan melihat bahwa mereka sedang menjadi cermin satu sama lain!
Di bawah lampu operasi pasar modal, konvergensi ini menjadi lebih jelas. Saat ini, valuasi kedua perusahaan di pasar sekunder sangat dekat, bahkan Anthropic baru-baru ini harganya sedikit lebih tinggi daripada OpenAI berkat lonjakan agresifnya di pasar enterprise. Indra modal paling tajam; dalam pandangan mereka, dua unicorn ini sedang tumbuh tanduk yang sama.

Tampaknya, homogenisasi model dasar pasti akan menyebabkan konvergensi aplikasi lapisan atas.
Hari ini, saya ingin membahas dua alat patokan yang mewakili tingkat tertinggi pemrograman berbantuan AI saat ini: Codex dari OpenAI dan Claude Code dari Anthropic. Dari awalnya berjalan terpisah, hingga kini mencapai tujuan yang sama, bagaimana keduanya secara bertahap berkembang menjadi serupa?
Dari Berpisah Jalan hingga Sampai pada Tujuan yang Sama: Sejarah Perkembangan Dua Kekuatan Utama
Kembalikan waktu beberapa tahun yang lalu, Codex dan Claude Code adalah produk dari dua filosofi teknologi yang sama sekali berbeda.
Logika dasar Codex adalah "dalam seni bela diri, kecepatan adalah segalanya." Ia seperti pengembang senior berpengalaman 5 tahun yang selalu mengikuti Anda dan siap melengkapi kode.

Dalam konsep OpenAI, Codex adalah agen terminal ringan dan highly interaktif yang menonjolkan iterasi cepat dan pemrograman interaktif. Kecepatan eksekusinya sangat tinggi, mampu mencapai throughput 1000 token per detik dengan dukungan perangkat keras Cerebras WSE-3. Dalam alur kerja spesifik, Codex menyediakan tiga mode persetujuan yang jelas: saran, sunting otomatis, dan otomatis penuh, memastikan pengembang tetap berada dalam siklus tersebut. Desain ini sangat sesuai dengan pengembang geek yang membutuhkan pembuatan prototipe cepat dan penanganan interaksi frekuensi tinggi.
Sebaliknya, Claude Code sejak awal muncul sudah membawa atribut "arsitek" yang dingin dan terkendali.

Anthropic telah menanamkan gen untuk menangani tugas-tugas ekstrem kompleks. Ia mengandalkan jendela konteks besar hingga 1 juta token, serta teknologi 'kompresi' unik untuk mencapai percakapan tak terbatas. Prinsip Claude Code adalah "menguasai secara menyeluruh, lalu bertindak dengan perencanaan matang." Sebelum menjalankan tindakan apa pun, ia terlebih dahulu menggunakan teknik pencarian agen untuk memahami seluruh struktur kodebase, lalu mengoordinasikan perubahan konsisten di banyak file. Untuk tugas rekonstruksi enterprise yang melibatkan migrasi puluhan ribu baris kode, Claude Code menunjukkan kekuasaan yang luar biasa.
Namun, seiring berjalannya waktu dan semakin luasnya penerapan aplikasi, dua alat yang awalnya sangat berbeda mulai saling meniru.

Sumber gambar: MorphLLM
Dalam menangani proyek kompleks, hambatan terbesar yang dihadapi model AI monolitik adalah konteks pencemaran. Ketika Anda meminta AI untuk merekonstruksi modul otorisasi, setelah membaca 40 file, seringkali ia sudah melupakan pola desain dari file pertama. Untuk mengatasi masalah ini, dua perusahaan memberikan jawaban yang hampir identik: alokasikan jendela konteks terpisah untuk setiap tugas sub.
OpenAI akan segera meluncurkan aplikasi desktop macOS baru yang mengisolasi tugas ke dalam thread berbeda berdasarkan proyek dan menjalankannya secara terpisah di sandbox cloud. Anthropic meluncurkan arsitektur tim agen yang memungkinkan pengembang membuat beberapa agen turunan yang berbagi daftar tugas dan ketergantungan, serta bekerja secara paralel di jendela independen masing-masing. Anda akan menemukan bahwa, entah itu disebut "cloud sandbox" atau "agent team", konsep inti dalam implementasi teknisnya telah sepenuhnya menyatu.
Pada laporan benchmark, keduanya menunjukkan keseimbangan halus. GPT-5.3-Codex memimpin dengan skor 77,3% pada tugas terminal Terminal-Bench 2.0. Claude Code meraih skor 80,8% pada daftar SWE-bench Verified yang kompleks. Keduanya mencapai puncak di area keunggulan masing-masing, sekaligus berusaha keras menutupi kelemahan mereka.
Efek OpenClaw: Tangan tak terlihat yang merobohkan tembok tinggi
Jika strategi internal dua perusahaan menentukan faktor internal yang mendorong mereka menuju homogenisasi, maka tekanan dari ekosistem open source secara keseluruhan merupakan kekuatan eksternal yang tidak dapat diabaikan. Di sini, kita harus menyebut dampak mendalam yang dibawa OpenClaw terhadap seluruh lanskap alat pemrograman AI.
Sebagai kerangka kerja alur yang diperkenalkan oleh komunitas open-source, munculnya OpenClaw dapat dikatakan meruntuhkan tembok ekosistem yang susah payah dibangun oleh para raksasa. Ia telah memstandarkan proses interaksi antara model besar dan rantai alat lokal. Dahulu, bagaimana membuat model besar memanggil commit Git secara elegan, bagaimana menjalankan skrip pengujian dengan aman di sandbox, dan bagaimana melakukan verifikasi inferensi multi-langkah, semuanya merupakan "teknologi rahasia" eksklusif yang menjadi kebanggaan Codex dan Claude Code.
Namun, OpenClaw telah mengabstraksi proses-proses ini menjadi protokol universal. Artinya, pengembang tidak lagi perlu terikat pada platform tertentu demi satu pola kolaborasi tertentu. Keria komunitas open-source menjadikan standardisasi sebagai arus besar yang tak terbendung. Menghadapi situasi ini, baik OpenAI maupun Anthropic harus menurunkan sikap mereka untuk kompatibel dengan standar terbuka ini.
Ketika hambatan teknis dasar diratakan oleh kekuatan open-source seperti OpenClaw, dan semua fitur canggih menjadi standar industri, satu-satunya jalan bagi Codex dan Claude Code adalah terus-menerus bersaing di tingkat pengalaman pengguna yang lebih halus. Inilah mengapa kita merasa semakin mirip satu sama lain—karena dalam kerangka yang distandarkan, solusi terbaik sering kali hanya ada satu—seperti evolusi konvergen pada makhluk hidup.
Codex sedang mengejar Claude Code
Meskipun Claude Code dan Codex sedang berada di jalur evolusi yang semakin mendekati, perbedaan antara keduanya masih ada, bahkan Codex telah lebih disukai oleh pengembang di beberapa aspek.
Dua hari yang lalu, di komunitas r/ClaudeCode, seorang insinyur senior dengan pengalaman 14 tahun yang pernah bekerja di perusahaan teknologi besar, u/Canamerican726, membagikan ulasan yang sangat mendalam.
Secara khusus, dalam proyek kompleks yang terdiri dari 80.000 baris kode, ia menghabiskan 100 jam menggunakan Claude Code dan 20 jam menggunakan Codex.

Dalam pandangannya, menggunakan Claude Code seperti membimbing seorang insinyur yang sedang dikejar tenggat waktu—ia berlari sangat cepat, tetapi sering mengabaikan spesifikasi yang ditulis pengembang di CLAUDE.md, serta suka menambahkan kode secara bertumpuk-tumpuk di file yang sudah ada untuk menyelesaikan tugas, tanpa memiliki pemikiran重构.
Sebaliknya, Codex memberinya kesan seperti seorang ahli berpengalaman 5 hingga 6 tahun yang tenang. Meskipun kecepatan pemrosesannya 3 hingga 4 kali lebih lambat, ia akan berhenti secara aktif di tengah jalan untuk memikirkan dan merekonstruksi kode, serta secara ketat mematuhi batasan perintah. Otonomi yang tinggi ini membuat insinyur ini berani langsung memberikan tugas kepadanya, lalu tenang melanjutkan pekerjaan lainnya.
Suara yang sama juga muncul di jaringan sosial seperti X. Peneliti Aran Komatsuzaki, berdasarkan pengalaman penggunaannya, menyebutkan bahwa di bidang frontend, Claude Code masih unggul, tetapi dalam perencanaan backend dan menjaga informasi tetap mutakhir, Codex yang sering memanggil pencarian web jelas lebih andal.

Kolom komentar dipenuhi ringkasan penuh darah dan air mata dari skenario bisnis nyata. Seorang pengembang dengan sangat tajam menunjukkan bahwa model berbasis Opus meskipun berjalan cepat, seringkali menumpuk banyak "utang pembersihan kode" bagi proyek, sementara Codex bergerak lambat, tetapi dapat membersihkan lantai sekaligus saat bergerak maju. Saya bahkan melihat seorang pengguna merangkum sebuah aturan bertahan hidup, menyarankan agar semua orang segera memulai sesi baru saat penggunaan jendela konteks mencapai 70%, karena sangat mudah menerima bug tersembunyi yang diberikan sistem.

Keluhan nyata dari lapangan ini secara jelas menunjukkan bahwa ketika fitur kedua alat utama semakin tumpang tindih, keputusan tentang afiliasi akhir pengembang sering kali ditentukan oleh perbedaan pengalaman kecil yang berkaitan dengan "biaya mengisi lubang" dan "pemeliharaan mental". Tentu saja, untuk pengguna Tiongkok, ada beberapa kesulitan khusus, seperti:

Pemikiran Dingin: Pertarungan Ekosistem di Balik Homogenisasi
Tentu, kelebihan dan kekurangan Codex dan Claude Code juga tergantung pada masing-masing pengembang, serta kemampuan pengembang itu sendiri, sebagaimana dirangkum dalam laporan ulasan u/Canamerican726 di atas: Jika Anda tidak memahami rekayasa perangkat lunak, kedua alat ini akan menghasilkan output yang buruk; alat tidak sama dengan keterampilan.
Kalimat ini menghancurkan ilusi yang telah lama dibangun oleh alat pemrograman AI. Kami pernah percaya bahwa dengan asisten AI yang cukup kuat, bahkan Vobe Coder tanpa dasar sekalipun bisa membuat aplikasi tingkat perusahaan sendirian. Namun kenyataannya, Claude Code membutuhkan 'pengemudi' yang sangat fokus dan terampil, jika tidak, ia mudah tersesat di dalam kodebase yang besar. Codex memang lebih mandiri, tetapi ia tetap memerlukan konteks sistem yang tepat dari pengembang untuk mencapai efisiensi maksimal.
Jadi, di era saat ini di mana kemampuan alat sangat homogen, di mana letak parit perlindungan kedua perusahaan ini berpindah?
Jawabannya tersembunyi di dalam laporan keuangan dan strategi penetapan harga yang membosankan. Dalam tugas yang sama, jumlah token yang dikonsumsi oleh Claude Code sering kali 3 hingga 4 kali lebih banyak daripada Codex. Biaya penggunaannya lebih tinggi. Untuk tim perusahaan, penggunaan Claude Code memerlukan biaya sebesar $100 hingga $200 per bulan untuk setiap pengembang. Sementara itu, Codex mengemas kemampuannya ke dalam rencana langganan yang lebih terjangkau, serta mengakumulasi basis pengguna besar melalui komunitas GitHub yang luas.

Sumber gambar: MorphLLM
Ambisi Anthropic adalah mengintegrasikan Claude Code secara mendalam ke dalam alur kerja perusahaan teknologi besar yang tidak kekurangan dana. Misalnya, Stripe memungkinkan 1.370 insinyur menggunakan Claude Code untuk menyelesaikan migrasi kode lintas bahasa yang sebelumnya memerlukan waktu beberapa minggu oleh 10 orang, dalam hanya 4 hari. Perusahaan Ramp bahkan mengandalkannya untuk memangkas waktu respons insiden sebesar 80%. OpenAI, di sisi lain, mengandalkan penetrasi ekosistemnya yang luas, menjadikan Codex sebagai pilihan default bagi banyak pengembang biasa.
Ini bukan lagi sekadar kompetisi teknis, melainkan perang habis-habisan tentang keterikatan ekosistem, strategi penetapan harga, dan pembentukan ulang kebiasaan pengguna.
Persimpangan Pengembang
Merefleksikan perkembangan teknologi selama tahun ini, peluncuran GPT-5.4-Cyber hanyalah catatan kecil dalam perang panjang ini. Codex dan Claude Code sedang menuju "wajah yang sama", menandai peralihan alat pemrograman AI dari tahap pengujian awal yang penuh ketidakpastian dan bersifat eksperimental menuju tahap produksi industri yang matang dan membosankan.
Saat ini, Claude Code secara otomatis menghasilkan 135.000 commit GitHub setiap hari, angka ini sudah mencakup 4% dari seluruh commit publik di jaringan. Kita dapat memprediksi bahwa dalam waktu dekat, sebagian besar kode样板, kasus uji dasar, serta refaktorisasi kode rutin akan diselesaikan secara diam-diam di latar belakang oleh agen AI yang semakin mirip satu sama lain.

Sumber gambar: MorphLLM & SemiAnalysis / GitHub Search API
Menghadapi dua alat super yang kemampuannya hampir tak terbedakan dan saling meniru pengalaman, nilai inti kita sebagai pengembang manusia masih tersisa apa? Mungkin masa keuntungan alat akan segera berakhir sepenuhnya. Ketika setiap orang memegang senjata yang sama tajamnya, yang menentukan kemenangan bukan lagi siapa yang memiliki kecepatan pelengkapan kode lebih baik, melainkan siapa yang mampu mendefinisikan masalah dengan lebih baik, siapa yang memiliki visi arsitektur sistem yang lebih luas, serta siapa yang mampu menemukan keunikan tak tergantikan manusia di dunia kode yang telah dipenuhi AI.
Ngomong-ngomong, kamu pilih yang mana?
Tautan referensi
https://www.morphllm.com/comparisons/codex-vs-claude-code
https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/
https://x.com/arankomatsuzaki/status/2044270102003196007
https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html
Artikel ini berasal dari akun WeChat "Machine Heart" (ID: almosthuman2014), penulis: Machine Heart
