Pertandingan Agen Teknologi Besar Berkembang Mengikut Empat Arah Utama

iconMetaEra
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Perlumbangan agen teknologi besar sedang dipercepat melalui empat bidang: alat produktiviti, integrasi produk, pertumbuhan ekosistem, dan pembinaan konteks. OpenAI, Microsoft, dan Tencent sedang menggabungkan chatbot dengan sistem agen, serta memasuki pasaran perniagaan dan pengguna akhir. Berita di rantai menunjukkan peningkatan kerjasama dengan pembangun dan rakan kongsi untuk memperluas kemampuan.
Menggeneralisasi Coding Agent ke skenario umum adalah persaingan peringkat sistem.

Penulis artikel, sumber: NarrowCast AI

Bagi bidang AI, minggu ini adalah minggu yang dipenuhi dengan berita-berita penting. Dari Huang Renxun menentukan semula AI PC, hingga Microsoft Build 2026 menyerukan "Agent-first", OpenAI mengumumkan penggabungan ChatGPT dan Codex, hingga perkembangan Agent WeChat dibeberkan, Qwen mula menyambungkan Skill pihak ketiga, DouBao menanggapi isu bayaran, serta laporan keuangan Meituan menekankan bahawa perkhidmatan AI Agent semakin penting.

Sebelum ini, ada yang bertanya mengapa OpenClaw yang dulu sangat popular tidak lagi dibincangkan? Mesej-mesej yang muncul minggu ini menjawab soalan ini dengan tindakan—orang tidak lagi membincangkan OpenClaw kerana Coding Agent kini menjadi penyelesaian universal untuk melaksanakan tugas, serta bergabung dengan Chatbot, sambil ekosistem Skill dan Agent yang sepadan juga mulai dibina, dan eksplorasi berbayar yang baru sedang dijalankan.

Syarikat besar sedang mengubah inspirasi dari OpenClaw menjadi kemajuan perniagaan yang nyata. Dalam proses ini, OpenClaw serta produk yang kita lihat sekarang mungkin bukan bentuk akhir bagi produk AI. Seperti yang dikatakan oleh姚顺雨, Saintis AI Utama Tencent, di Konvensyen Aplikasi AI Industri Tencent Cloud 2026, satu perubahan jangka panjang baru sahaja bermula, dan bentuk produk sebenar, peluang perniagaan, serta cara penggunaan masih jauh daripada ditemui sepenuhnya.

Yang pasti ialah, Agen sedang menjadi medan pertempuran utama dalam AI syarikat besar, dan bentuk persaingan ini sedang berkembang sepanjang empat garis utama: siapa yang boleh memperluaskan pengguna dalam lebih banyak skenario produktiviti; siapa yang boleh mengintegrasikan produk dalaman secara lebih mendalam; siapa yang boleh membina ekosistem Skill dan Agen yang cukup kaya; dan siapa yang boleh mengumpulkan konteks yang mencukupi.

“Rakan sekerja” menjadi fokus persaingan sebagai Agent

“Rakan sekerja” adalah perkataan yang paling sering digunakan untuk menggambarkan Agent semasa ini. Scout daripada Microsoft direka untuk bekerja “seperti rakan sekerja”; Koubu 3.0 menekankan kerjasama antara manusia dan pasukan AI; sementara plugin Agent yang dilancarkan oleh OpenAI digambarkan sebagai “rakan sekerja baharu yang telah selesai proses masuk dan memahami semua prosedur”.

Pernyataan-pernyataan ini bermaksud bahawa skenario produktiviti telah menjadi fokus persaingan Agent dari syarikat besar.

Scout yang dilancarkan oleh Microsoft adalah agen yang dibina berdasarkan kerangka OpenClaw, beroperasi secara berterusan dalam Microsoft 365, boleh berjalan di Teams, dan bekerjasama dengan aplikasi pejabat seperti Outlook dan OneDrive, untuk melayari e-mel, kalendar, dan mesej kerja, serta mengurus konflik mesyuarat, menyusun balasan, dan memajukan tugas secara automatik. Sementara itu, Microsoft juga melancarkan Agent 365 untuk pengurusan terpusat identiti, kebenaran, dasar, dan risiko agen bagi perusahaan.

OpenAI pula menetapkan tema acara tersebut secara langsung sebagai "Intelligence at Work". Dalam acara ini, OpenAI membawa tiga peningkatan utama untuk Codex: memperkenalkan plugin Agent dengan kemampuan disesuaikan; memperluas kemampuan suntingan lokal dari kod dan laman web ke dokumen, jadual, dan PPT; serta kemampuan untuk menghasilkan laporan melalui pembangunan laman web.

Sementara itu, dalam responsnya mengenai fungsi berbayar, DouBao menyatakan bahawa demi memenuhi keperluan produktiviti kalangan profesional, DouBao merancang untuk melancarkan versi profesional DouBao yang akan merangkumi perkhidmatan profesional seperti pembangunan perisian, analisis data, reka bentuk profesional, automatik proses, analisis kewangan, dan penyelidikan saintifik.

Tindakan produk ini menunjukkan bahawa nilai besar dalam skenario produktiviti—bukan hanya skenario perniagaan secara tradisional—telah disahkan dengan wang sungguhan.

Data yang dikeluarkan oleh OpenAI menunjukkan bahawa sejak Februari tahun ini, pengguna aktif mingguan Codex meningkat enam kali ganda kepada 5 juta, dengan kadar pertumbuhan pekerja pengetahuan tiga kali lebih pantas berbanding pembangun. Pendapatan Anthropic untuk kuartal kedua dijangka meningkat lebih daripada dua kali ganda kepada US$10.9 bilion, dan berpotensi mencapai keuntungan operasi sebanyak US$559 juta, dengan sebahagian besar pendapatan berasal dari perusahaan dan syarikat rintisan.

Integrasi dan penghubungan produk dalaman terus diperdalam

Pembaruan dan pengulangan produk berkaitan dengan penyusunan semula struktur produk yang lebih mendalam. Pada satu sisi, syarikat besar pada masa ini hampir semuanya telah menyusun Chatbot dan satu atau lebih produk Agent, dan pengintegrasian produk-produk ini kini telah bermula. Yang paling agresif ialah pengintegrasian ChatGPT dan Codex oleh OpenAI.

OpenAI ingin meningkatkan ChatGPT daripada sekadar antaramuka perbualan menjadi antaramuka utama untuk bekerjasama dengan Agent, manakala Codex akan ditingkatkan menjadi platform Agent generik yang mampu memenuhi keperluan kerja dalam pelbagai skenario seperti pejabat, penyelidikan, proses perusahaan, analisis data, dan operasi perniagaan, dengan intinya adalah generalisasi skenario penggunaan Coding Agent. Melalui integrasi ini, OpenAI berharap dapat memperkenalkan Codex kepada kumpulan pengguna besar ChatGPT dan memperluas basis pengguna berbayar.

Masih ada berita yang menunjukkan bahawa OpenAI merancang untuk melibatkan peranti pelayar AI Atlas dalam integrasi aplikasi AI super ini.

Di sisi lain, kemampuan dan perkhidmatan produk internet lama dari syarikat besar sedang dengan cepat diintegrasikan ke dalam produk AI dalam bentuk Skill atau Agent. Alibaba menambahkan kemampuan memesan makanan, memanggil teksi, dan belanja di Taobao ke Qwen merupakan eksplorasi awal. Kini, kita dapat melihat ByteDance, Meituan, dan Tencent melakukan kerja serupa.

ByteDance setelah mengintegrasikan Douyin Mall ke dalam DouBao, kini semakin meningkatkan rekomendasi toko dan paket kumpulan untuk perkhidmatan kehidupan tempatan seperti makanan, tiket filem, dan penginapan. Meituan menyatakan dalam sidang laporan kewangan bahawa pembantu AI "Xiao Tuan" telah dipasang ke dalam aplikasi Meituan, dan dalam tempoh Cuti Hari Pekerja, ia melayani lebih daripada 100 juta pengguna, mencakupi skenario makan minum, hiburan, perjalanan, dan konsultasi perubatan. Dokumen Tencent juga telah mengubah kemampuan pemprosesan dokumen yang telah dikumpulkan sebelum ini menjadi Skill, yang dipanggil oleh WorkBuddy.

Pengurus Eksekutif Tinggi Grup Tencent, Tang Daosheng, menyatakan semasa Konvensyen Aplikasi AI Tencent Cloud 2026 bahawa banyak fungsi aplikasi tradisional perlu ditukar menjadi kemampuan yang boleh dipanggil oleh agen pintar untuk melepaskan nilai yang telah dikumpulkan selama bertahun-tahun. Oleh itu, pada tahun ini, WeChat for Business telah membuka kemampuan data asalnya melalui antaramuka dan Skill, membenarkan agen pintar lain memanggilnya. Tren pembukaan ini semakin jelas.

Pembinaan ekosistem pihak ketiga telah dimulakan

Perbezaan utama agen dengan produk sebelumnya ialah ia mempunyai kemampuan untuk memanggil alat. Ini memerlukan ekosistem alat yang cukup kaya di belakang agen. Walaupun syarikat besar, sulit untuk membina ekosistem ini sendirian. Ini memerlukan pembinaan ekosistem Skill atau agen pihak ketiga.

Pembinaan ekosistem ini kini telah dimasukkan ke dalam agenda.

Setelah menyelesaikan integrasi produk dan perkhidmatan pihak pertama Alibaba, Qwen mengumumkan pembukaan penuh kepada Agent dan Skill pihak ketiga, membolehkan semua perusahaan mengendalikan Agent merek mereka sendiri di Qwen. Pek ini, Luckin Coffee, KFC, Mixue Ice Cream & Tea, dan China Eastern Airlines telah melancarkan Skill di Qwen. Selepas itu, perusahaan juga akan dapat menyesuaikan persona Agent dan perkhidmatan spesifik mereka di Qwen.

Tencent pula, di satu sisi, mengintegrasikan Xiao Mei dari Meituan ke Yuan Bao untuk menyediakan perkhidmatan seperti tempahan makanan dan penghantaran kepada pengguna; di sisi lain, mempercepat pembinaan ekosistem Agent WeChat.

Laporan media menunjukkan bahawa Agent WeChat telah menyelesaikan ujian prototaip dan paling cepat akan memulakan proses persetujuan pematuhan sebelum pelancaran awam pada bulan ini. Agent ini mampu mengendalikan aplikasi mini WeChat untuk menyediakan perkhidmatan kompleks seperti memesan makanan, memanggil teksi, memesan tiket, berbelanja, dan kehidupan tempatan.

Selain itu, WeChat juga sedang mencuba membina sambungan Agent to Agent dengan pengilang telefon seperti Honor dan Xiaomi, supaya kemampuan asasnya boleh dipanggil oleh Agent pengilang telefon. Dengan kata lain, pengilang telefon juga akan menjadi pintu masuk baharu kepada ekosistem Agent WeChat, membentuk struktur di mana beberapa pintu masuk menggunakan ekosistem Agent yang sama.

Plug-in Agent OpenAI boleh mengemas semula alat, pengetahuan, dan kemahiran yang diperlukan untuk jawatan tersebut dalam satu paket. Sebagai contoh, plug-in penghasilan kreatif boleh menghasilkan papan kempen, variasi iklan paparan, gambar gaya hidup produk, dan koleksi gambar e-dagang berdasarkan brief, serta boleh memanggil alat-alat seperti Figma, Canva, Shutterstock, Picsart, Fal, dan sebagainya. Dengan cara yang mudah difahami, ini adalah satu sistem warisan kerjaya yang disediakan khas untuk Agent.

Sekarang, plug-in Agent Codex meliputi 62 aplikasi popular dan 110 kemahiran. Seterusnya, OpenAI berharap untuk membuka ekosistem plug-in kepada rakan kongsi, membolehkan pihak ketiga mencipta dan melancarkan plug-in mereka sendiri secara langsung di Codex dan ChatGPT.

Konteks menjadi lebih penting

Yao Shunyu menyatakan bahawa model semakin mahir dalam mengubah input yang kompleks menjadi output, tetapi dengan syarat ia mendapat input yang cukup baik. Ini memerlukan pengguna menyediakan maklumat yang cukup terperinci dan berguna kepada model dan Agent, supaya model dan Agent dapat memahami soalan-soalan yang menjadi penentu laluan yang betul, seperti “Siapakah anda?”, “Apa yang sedang anda lakukan?”, dan “Apakah jawapan yang bernilai untuk anda?”

Di peringkat pembangunan, komunikasi konteks yang mencukupi juga diperlukan dalam pembangunan produk AI. Yao Shunyu dan Tang Daosheng menyebut dalam perbincangan mereka di acara tersebut bahawa pembangunan produk AI perlu menentukan apa yang perlu dihargai dan dihukum oleh model berdasarkan maklum balas produk, serta apa yang dianggap jawapan yang baik dan tingkah laku yang buruk. Ini bermakna, pasukan model dan pasukan produk perlu melalui proses perkongsian konteks untuk menyelesaikan Co-Design dan bersama-sama mencipta pengalaman yang lebih baik.

Oleh itu, produk AI perlu menyambung dan mengumpulkan maklumat konteks pelbagai sumber di sisi pengguna, kemudian menyesuaikan niat tugas dengan agen dengan menentukan maklumat apa yang perlu diberikan dan apa yang tidak perlu diberikan; di sisi pembangunan, mekanisme umpan balik yang lancar perlu dibina untuk menyelaraskan matlamat pembangunan antara pasukan model dan pasukan produk, serta mempercepatkan penambahbaikan pengalaman.

Baik akumulasi konteks dari sisi pengguna mahupun perkongsian konteks dari sisi pembangunan, bukan sahaja merupakan masalah pembangunan, tetapi juga masalah organisasi, yang perlu dicapai melalui kerjasama untuk mengakumulasi dan berkongsi konteks.

Inilah sebabnya, OpenAI mula menyusun semula pasukan pada Januari tahun ini untuk mempererat kerjasama antara pasukan produk dan penyelidik yang bertanggungjawab atas model asas yang berkaitan; kemudian menggabungkan pasukan ChatGPT, Codex, dan API menjadi satu jabatan yang dikendalikan oleh Thibault Sottiaux.

Sambil menekankan konteks, ia juga mungkin merangsang pengagentan peranti keras, menjadikan peranti keras sebagai saluran yang berkesan untuk mengumpul konteks pengguna. Projek Project Solara Microsoft sedang menjalankan eksplorasi ini. Komunikasi secara berterusan bukanlah satu-satunya tujuan dalam membangun terminal desktop dan peranti mudah alih Agent; tujuan utama lebih kepada menyediakan lebih banyak maklumat konteks untuk tugas Agent dalam skenario desktop dan mudah alih.

Dalam beberapa tahun terakhir, industri AI telah menunjukkan lintasan teknologi yang relatif jelas: pra-pelatihan → pasca-pelatihan → Agent → Coding Agent. Lintasan ini mungkin bukan satu-satunya arah utama di masa depan, tetapi merupakan arah paling efektif yang boleh ditangkap oleh syarikat besar pada masa ini.

Empat tren yang kami rumuskan adalah koordinat dasar yang saling terhubung dalam lintasan tetap, yang semuanya bertujuan untuk mewujudkan generalisasi Coding Agent ke dalam skenario umum. Ini lagi-lagi merupakan persaingan tingkat sistem.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.