Menggeneralisasi Coding Agent ke skenario umum adalah persaingan tingkat sistem.

Penulis artikel, sumber: Narrowcast AI

Minggu ini merupakan minggu penuh pengumuman besar bagi bidang AI. Dari Huang Renxun yang mendefinisikan ulang AI PC, hingga Microsoft Build 2026 yang menyerukan "Agent-first", OpenAI mengumumkan penggabungan ChatGPT dan Codex, hingga terungkapnya perkembangan Agent WeChat, Qwen yang mulai mengintegrasikan Skill pihak ketiga, Doubao merespons desas-desus tentang berbayar, serta penekanan dalam rapat laporan keuangan Meituan bahwa layanan AI Agent semakin penting.

Sebelumnya ada yang bertanya mengapa OpenClaw yang dulu sangat populer tidak lagi dibahas? Pesan-pesan minggu ini menjawab pertanyaan itu dengan tindakan nyata—orang-orang tidak lagi membahas OpenClaw, karena Coding Agent kini menjadi solusi universal untuk menjalankan tugas, bergabung dengan Chatbot, sekaligus membangun ekosistem Skill dan Agent yang sesuai, sambil melakukan eksplorasi berbayar baru.

Perusahaan besar sedang mengubah wawasan yang dibawa oleh OpenClaw menjadi kemajuan bisnis nyata. Dalam proses ini, OpenClaw serta produk yang kita lihat saat ini mungkin bukanlah bentuk akhir dari produk AI. Seperti yang dikatakan oleh Yao Shunyu, Ilmuwan AI Utama Tencent, di Konferensi Aplikasi Industri AI Tencent Cloud 2026, perubahan jangka panjang baru saja dimulai, dan bentuk produk, peluang bisnis, serta cara penggunaan yang sebenarnya masih jauh dari tercipta sepenuhnya.

Yang dapat kami pastikan adalah bahwa agen sedang menjadi medan pertempuran utama dalam AI perusahaan besar, dan bentuk persaingan ini terus berkembang sepanjang empat garis utama: siapa yang dapat memperluas pengguna di lebih banyak skenario produktivitas; siapa yang dapat mengintegrasikan produk internal secara lebih mendalam; siapa yang dapat membangun ekosistem Skill dan Agen yang cukup kaya; dan siapa yang dapat mengakumulasi cukup konteks.

"Rekan kerja" menjadi fokus persaingan sebagai Agent

“Rekan kerja” adalah kata yang paling sering digunakan untuk menggambarkan Agent saat ini. Microsoft Scout dirancang untuk bekerja “seperti rekan kerja”; Button 3.0 menekankan kolaborasi antara manusia dan tim AI; plugin Agent yang diluncurkan oleh OpenAI digambarkan sebagai “rekan kerja baru yang sudah menyelesaikan onboarding dan memahami seluruh prosedur”.

Pernyataan ini berarti bahwa skenario produktivitas telah menjadi fokus persaingan Agent dari perusahaan besar.

Scout yang diluncurkan oleh Microsoft adalah Agent yang dibangun berdasarkan kerangka OpenClaw, berjalan terus-menerus di Microsoft 365, dapat beroperasi di Teams, dan berkolaborasi dengan aplikasi kantor seperti Outlook dan OneDrive, menelusuri email, kalender, dan pesan kerja, serta secara otomatis menangani konflik rapat, menyusun balasan, dan mendorong tugas. Seiring itu, Microsoft juga meluncurkan Agent 365 untuk mengelola identitas, izin, kebijakan, dan risiko Agent secara terpusat bagi perusahaan.

OpenAI langsung menetapkan tema acara tersebut sebagai "Intelligence at Work". Dalam acara ini, OpenAI melakukan tiga peningkatan utama pada Codex: meluncurkan plugin Agent dengan kemampuan disesuaikan; memperluas kemampuan suntingan lokal dari kode dan halaman web ke dokumen, tabel, dan PPT; serta kemampuan menghasilkan laporan melalui pembuatan situs web.

Sementara itu, dalam respons terhadap fitur berbayar, DouBao menyebutkan bahwa demi memenuhi kebutuhan produktivitas kalangan profesional, DouBao berencana meluncurkan versi profesional DouBao yang akan mencakup layanan profesional seperti pengembangan perangkat lunak, analisis data, desain profesional, otomatisasi proses, analisis keuangan, dan penelitian ilmiah.

Tindakan produk ini menunjukkan bahwa nilai besar dari skenario produktivitas—bukan hanya skenario perusahaan dalam arti tradisional—telah diverifikasi dengan uang sungguhan.

Data yang dirilis oleh OpenAI menunjukkan bahwa sejak Februari tahun ini, pengguna aktif mingguan Codex meningkat enam kali lipat menjadi 5 juta, dengan laju pertumbuhan pekerja pengetahuan tiga kali lebih cepat daripada pengembang. Pendapatan Anthropic pada kuartal kedua diperkirakan meningkat lebih dari dua kali lipat menjadi $10,9 miliar, dan berpotensi mencapai laba operasional sebesar $559 juta, dengan sebagian besar pendapatannya berasal dari perusahaan dan startup.

Integrasi dan koneksi produk internal terus diperdalam

Pembaruan dan iterasi produk sesuai dengan restrukturisasi arsitektur produk yang lebih mendalam. Di satu sisi, perusahaan besar saat ini pada dasarnya telah mengembangkan Chatbot dan satu atau lebih produk Agent, dan kini integrasi terhadap produk-produk ini telah dimulai. Yang paling agresif adalah integrasi OpenAI terhadap ChatGPT dan Codex.

OpenAI ingin mengubah ChatGPT dari sekadar antarmuka percakapan menjadi antarmuka utama untuk kolaborasi Agent, sementara Codex akan ditingkatkan menjadi platform Agent universal yang mampu memenuhi kebutuhan kerja di berbagai skenario seperti kantor, penelitian, proses perusahaan, analisis data, dan operasi bisnis, dengan inti berupa generalisasi skenario penggunaan Coding Agent. Melalui integrasi ini, OpenAI berharap dapat memperluas penerapan Codex kepada basis pengguna besar ChatGPT dan memperluas jumlah pengguna berbayar.

Masih ada kabar bahwa OpenAI berencana melibatkan browser AI Atlas dalam integrasi aplikasi AI super ini.

Di sisi lain, integrasi terjadi ketika kemampuan dan layanan produk internet milik perusahaan besar dengan cepat diintegrasikan ke dalam produk AI dalam bentuk Skill atau Agent. Alibaba menambahkan kemampuan memesan makanan, memesan taksi, dan berbelanja di Taobao ke Qwen, yang merupakan eksplorasi awal. Sekarang, kita dapat melihat ByteDance, Meituan, dan Tencent melakukan pekerjaan serupa.

ByteDance setelah mengintegrasikan Douyin Mall ke DouBao, kini menambahkan rekomendasi toko dan paket grup untuk layanan kehidupan lokal seperti makanan, tiket bioskop, dan akomodasi liburan. Meituan menyatakan dalam rapat laporan keuangan bahwa asisten AI "Xiao Tuan" telah diintegrasikan ke dalam aplikasi Meituan, melayani lebih dari seratus juta pengguna selama liburan Hari Buruh, mencakup berbagai skenario seperti makanan, hiburan, transportasi, dan konsultasi medis. Dokumen Tencent juga mengubah kemampuan pemrosesan dokumen yang telah dikumpulkan sebelumnya menjadi Skill yang dapat dipanggil oleh WorkBuddy.

Wang Dao Sheng, Senior Executive Vice President of Tencent Group, menyatakan selama Konferensi Aplikasi Industri AI Tencent Cloud 2026 bahwa banyak fungsi aplikasi tradisional di masa lalu perlu diubah menjadi kemampuan yang dapat dipanggil oleh agen cerdas agar nilai yang telah terakumulasi selama bertahun-tahun dapat dilepaskan lebih lanjut. Oleh karena itu, tahun ini WeCom telah membuka beberapa kemampuan data sebelumnya melalui antarmuka dan Skill, memungkinkan agen lain untuk memanggilnya. Tren keterbukaan ini semakin jelas.

Pembangunan ekosistem pihak ketiga mulai dimasukkan ke dalam agenda

Perbedaan utama Agent dengan produk sebelumnya adalah kemampuannya untuk memanggil alat. Hal ini mengharuskan Agent memiliki ekosistem alat yang cukup kaya. Bahkan perusahaan besar pun sulit membangun ekosistem ini sendiri. Oleh karena itu, diperlukan pembangunan ekosistem Skill atau Agent dari pihak ketiga.

Pembangunan ekosistem ini sekarang telah diprioritaskan.

Setelah menyelesaikan integrasi produk dan layanan pihak pertama Alibaba, Qwen mengumumkan akan secara luas membuka akses bagi Agent dan Skill pihak ketiga, memungkinkan semua perusahaan untuk menjalankan Agent merek mereka sendiri di Qwen. Pekan ini, Luckin Coffee, KFC, Mixue Ice Cream & Tea, dan China Eastern Airlines telah meluncurkan Skill di Qwen. Selanjutnya, perusahaan juga dapat menyesuaikan karakter dan layanan spesifik Agent di Qwen.

Tencent, di satu sisi, mengintegrasikan Xiao Mei dari Meituan ke Yuanbao untuk menyediakan layanan seperti pemesanan makanan dan pengiriman kepada pengguna; di sisi lain, mempercepat pembangunan ekosistem Agent WeChat.

Laporan media menunjukkan bahwa Agent WeChat telah menyelesaikan pengujian prototipe dan paling cepat akan memulai proses persetujuan kepatuhan sebelum peluncuran publik bulan ini. Agent ini dapat mengoordinasikan小程序 WeChat untuk menyediakan layanan kompleks seperti pemesanan makanan, panggilan taksi, pemesanan tiket, belanja, dan kehidupan lokal.

Selain itu, WeChat juga sedang mencoba membangun koneksi Agent to Agent dengan produsen ponsel seperti Honor dan Xiaomi, agar kemampuan dasarnya dapat dipanggil oleh Agent produsen ponsel. Artinya, produsen ponsel juga akan menjadi pintu masuk baru bagi ekosistem Agent WeChat, membentuk arsitektur di mana beberapa pintu masuk menggunakan satu ekosistem Agent yang sama.

Plugin Agent dari OpenAI dapat mengemas secara sekaligus alat, pengetahuan, dan keterampilan yang dibutuhkan untuk suatu posisi. Misalnya, plugin produksi kreatif dapat menghasilkan campaign board, varian iklan display, gambar gaya hidup produk, dan koleksi gambar e-commerce berdasarkan brief, serta dapat memanggil alat-alat seperti Figma, Canva, Shutterstock, Picsart, Fal, dll. Secara sederhana, ini adalah sistem warisan profesi yang disiapkan untuk Agent.

Saat ini, plugin Agent Codex mencakup 62 aplikasi populer dan 110 keterampilan. Selanjutnya, OpenAI berharap untuk membuka ekosistem plugin kepada mitra, memungkinkan pihak ketiga membuat dan mendeploy plugin mereka sendiri langsung di Codex dan ChatGPT.

Konteks menjadi lebih penting

Yao Shunyu menyatakan bahwa model semakin mahir mengubah input kompleks menjadi output, tetapi dengan syarat model dapat memperoleh input yang cukup baik. Hal ini memerlukan agar pengguna dapat menyediakan informasi yang cukup rinci dan berguna bagi model dan Agent, sehingga model dan Agent dapat memahami pertanyaan-pertanyaan yang menjadi penanda jalur yang benar, seperti "Siapa Anda?", "Apa yang sedang Anda lakukan?", dan "Jawaban apa yang bernilai bagi Anda?"

Di sisi pengembangan, pengembangan produk AI juga memerlukan komunikasi kontekstual yang memadai. Dalam diskusi di acara tersebut, Yao Shunyu dan Tang Daosheng menyebutkan bahwa pengembangan produk AI harus menentukan apa yang harus dihargai dan dihukum oleh model berdasarkan umpan balik produk, serta apa yang dianggap jawaban baik dan perilaku buruk. Ini berarti tim model dan tim produk perlu melalui proses berbagi konteks untuk menyelesaikan Co-Design dan bersama-sama menciptakan pengalaman yang lebih baik.

Oleh karena itu, produk AI di sisi pengguna harus menghubungkan dan mengakumulasi informasi konteks dari berbagai sumber, lalu menyelaraskan niat tugas dengan agen dengan memutuskan informasi apa yang harus diberikan dan apa yang tidak boleh diberikan; di sisi pengembangan, perlu membangun mekanisme umpan balik yang lancar untuk menyelaraskan tujuan pengembangan antara tim model dan tim produk, serta mempercepat optimasi pengalaman.

Baik akumulasi konteks di sisi pengguna maupun berbagi konteks di sisi pengembangan bukan hanya masalah teknis, tetapi juga masalah organisasi, yang harus dicapai melalui kolaborasi untuk mengakumulasi dan berbagi konteks.

Inilah mengapa OpenAI mulai mereorganisasi tim pada Januari tahun ini untuk mempererat kolaborasi antara tim produk dan peneliti yang bertanggung jawab atas model dasar terkait, lalu menggabungkan tim ChatGPT, Codex, dan API menjadi satu departemen yang dipimpin oleh Thibault Sottiaux.

Sambil menekankan konteks, hal ini juga dapat mendorong agensifikasi perangkat keras, menjadikan perangkat keras sebagai saluran efektif bagi agen untuk mengumpulkan konteks pengguna. Proyek Project Solara dari Microsoft sedang mengeksplorasi hal ini. Komunikasi kapan saja dan di mana saja bukan satu-satunya tujuan mengembangkan terminal desktop agen dan perangkat portabel; tujuan utamanya adalah memberikan lebih banyak informasi konteks kepada agen untuk menjalankan tugas dalam skenario desktop dan seluler.

Dalam beberapa tahun terakhir, industri AI menunjukkan jalur teknis yang relatif jelas: pra-pelatihan → pelatihan lanjutan → Agent → Coding Agent. Jalur ini mungkin bukan satu-satunya arah utama di masa depan, tetapi merupakan arah paling efektif yang dapat diambil oleh perusahaan besar saat ini.

Empat tren yang kami identifikasi adalah koordinat dasar yang saling terhubung dalam jalur tetap, yang semuanya bertujuan untuk mewujudkan generalisasi Coding Agent ke dalam skenario umum. Ini lagi-lagi merupakan persaingan tingkat sistem.

Kompetisi Agen Big Tech Berkembang Melalui Empat Arah Utama

"Rekan kerja" menjadi fokus persaingan sebagai Agent

Integrasi dan koneksi produk internal terus diperdalam

Pembangunan ekosistem pihak ketiga mulai dimasukkan ke dalam agenda

Konteks menjadi lebih penting