Tulisan | Huruf AI
Google benar-benar panik.
Baru sahaja berita muncul bahawa salah seorang penemu bersama Google, Sergey Brin, telah memulakan semula "modus penemu", mengawasi secara langsung dan membentuk pasukan elit "serangan pantas" untuk sepenuhnya meningkatkan kemampuan Gemini dalam pemrograman AI dan agen autonomi, serta mengejar pesaing seperti Anthropic.
Tidak lama selepas itu, Google mengumumkan pembaharuan besar pada waktu malam, melancarkan dua agen penyelidikan swakendali generasi baru yang dibina berdasarkan model Gemini 3.1 Pro: Deep Research dan Deep Research Max.
Selain memperkuat kemampuan penalaran di peringkat dasar model, kami juga secara agresif mendorong perkembangan agen penyelidikan mandiri menuju arah platform perusahaan dan pembangun, dengan membuka API, menyokong data peribadi, tugas asinkron latar belakang, dan sebagainya, untuk merebut keunggulan awal dalam skenario bernilai tinggi “alat penyelidikan/analisis AI” dan menghadapi persaingan daripada pesaing seperti OpenAI (Hermes) dan Perplexity.

Dua agen ini pertama kali membolehkan pembangun menggabungkan data rangkaian terbuka dengan maklumat eksklusif perusahaan melalui satu panggilan API sahaja, serta menghasilkan grafik dan infografik secara native dalam laporan penyelidikan, sambil menyambung ke sumber data pihak ketiga mana-mana melalui Model Context Protocol (MCP).
Dua agen kini boleh diakses melalui pakej berbayar Gemini API dalam versi pra-pelancaran awam, melalui Interactions API yang diperkenalkan pertama kali oleh Google pada Disember 2025.
Betul, agen-agen baru ini hanya boleh digunakan melalui API; pengguna biasa tidak dapat menikmatinya di aplikasi Gemini, walaupun telah berlanggan berbayar. Melihat pembaruan tetapi tidak dapat menggunakannya, beberapa pengguna mengeluh: “Google entah mengapa terus menghukum pengguna Pro yang berlanggan aplikasi Gemini…”

Pengarah eksekutif Google, Sundar Pichai, juga terus terlibat secara langsung di X: "Gunakan Deep Research apabila anda memerlukan kelajuan dan kecekapan; gunakan versi Max apabila anda mengejar kualiti tertinggi dalam pengumpulan dan sintesis konteks—ia mencapai 93.3% untuk DeepSearchQA dan 54.6% untuk HLE melalui pengembangan pengiraan semasa ujian."

18 bulan yang lalu, matlamat Google Deep Research ialah untuk membantu pelajar siswazah mengelakkan daripada ditenggelamkan oleh jumlah tab pelayar yang banyak. Kini, Google ingin ia menggantikan kerja penyelidikan asas analis peringkat permulaan di bank pelaburan.
Kesenjangan antara dua sasaran ini—dan sama ada teknologi ini benar-benar dapat menutup kesenjangan tersebut—akan menentukan sama ada agen penyelidikan autonomi akan menjadi produk revolusioner dalam bidang perisian perusahaan, atau hanya menjadi satu lagi demonstrasi kecerdasan buatan yang menarik dalam ujian piawai tetapi mengecewakan dalam persidangan.
Dua versi, disesuaikan dengan beban kerja yang berbeza
Versi Standard Deep Research mempunyai latensi yang lebih rendah dan kos yang lebih rendah, sesuai untuk skenario yang memerlukan kelajuan.
Deep Research Max mengutamakan kedalaman berbanding kelajuan. Agen ini melakukan penarikan mendalam, pencarian, dan lelaran melalui pengiraan masa ujian yang diperluaskan (extended test-time compute) untuk menghasilkan laporan akhir.
Google menunjukkan bahawa aliran kerja latar belakang asinkron adalah skenario penggunaan idealnya, contohnya dijalankan melalui tugas berkala (cron job) pada waktu malam, sehingga laporan penyelidikan menyeluruh boleh diserahkan kepada pasukan analis pada esok harinya.
Dalam ujian piawai sendiri Google, Deep Research Max mencapai kemajuan ketara dalam tugas pencarian dan penalaran. Agen ini mampu mendapatkan maklumat dari lebih banyak sumber berbanding versi sebelumnya dan menangkap perbezaan halus yang mudah diabaikan oleh model lama.

Google juga memberikan perbandingan melintang dengan pesaing.
Namun, perbandingan dengan GPT-5.4 dari OpenAI dan Opus 4.6 dari Anthropic tidak sepenuhnya adil. GPT-5.4 berprestasi baik dalam pencarian web otonom, tetapi tidak dioptimalkan secara khusus untuk penelitian mendalam. Untuk tujuan ini, OpenAI menyediakan agen DR sendiri, yang beralih ke GPT-5.2, bukan GPT-5.4, setelah pembaruan pada Februari. Model pencarian terkuat OpenAI sebenarnya adalah GPT-5.4 Pro, tetapi Google jelas tidak memasukkannya ke dalam perbandingan tersebut.

Berdasarkan data OpenAI, GPT-5.4 Pro mencapai skor tertinggi 89.3% dalam ujian pencarian agen BrowseComp, manakala GPT-5.4 mendapat skor 82.7%.
Berdasarkan laporan sendiri dari Anthropic, Opus 4.6 mendapat skor 84% di BrowseComp, yang lebih tinggi daripada nilai yang ditunjukkan oleh Google. Skor ini dicapai dengan fungsi penalaran dimatikan, di mana model tersebut justru berprestasi lebih baik daripada pengaturan penalaran intensif yang digunakan Google dalam ujian API.
Kesenjangan ini kemungkinan besar berasal dari perbezaan kaedah pengujian—model dievaluasi melalui API asal, atau diwadahi dalam rantai alat masing-masing makmal. Data Google mungkin tidak salah, tetapi perlu ditafsirkan dengan berhati-hati. Bagaimanapun, cara penyajiannya kurang transparan.
Dokong MCP
Fungsi paling berkesan dalam pelancaran ini ialah penambahan sokongan untuk Model Context Protocol (MCP). Fungsi ini mengubah Deep Research daripada alat penyelidikan web yang kuat menjadi entiti yang lebih hampir kepada “analisis data generik”.
MCP ialah standard terbuka baharu yang digunakan untuk menyambungkan model AI ke sumber data luar. Ia membolehkan Deep Research untuk menghantar soalan selamat ke pangkalan data peribadi, perpustakaan dokumen dalaman, dan perkhidmatan data pihak ketiga profesional—dengan sepanjang proses tersebut, maklumat sensitif tidak perlu keluar daripada persekitaran asalnya.
Dalam aplikasi sebenar, ini bermakna sebuah dana hedging boleh secara serentak mengarahkan Deep Research ke pangkalan data aliran perdagangan dalaman dan terminal data kewangan, kemudian meminta agen untuk menggabungkan kedua-duanya dengan maklumat awam dari internet untuk menghasilkan wawasan yang menyeluruh.
Google mengungkapkan sedang bekerja sama secara aktif dengan perusahaan-perusahaan seperti FactSet, S&P, dan PitchBook untuk merancang server MCP-nya, yang secara jelas menunjukkan bahwa Google sedang mencari integrasi mendalam dengan penyedia data yang secara harian digunakan oleh Wall Street dan industri jasa keuangan yang lebih luas.
Menurut artikel blog yang ditulis oleh produk manager Google DeepMind, Lukas Haas dan Srinivas Tadepalli, matlamatnya adalah “membolehkan pelanggan bersama mengintegrasikan produk data kewangan ke dalam alur kerja yang didorong oleh Deep Research, serta mencapai lompatan produktiviti dengan memanfaatkan alam semesta data yang luas untuk mengumpulkan konteks dengan kelajuan kilat.”
Fungsi ini secara langsung menyelesaikan salah satu masalah paling sulit dalam penggunaan AI oleh perusahaan: jurang besar antara maklumat yang boleh diperoleh model daripada internet terbuka dengan maklumat yang diperlukan oleh organisasi untuk membuat keputusan. Sebelum ini, menutup jurang ini memerlukan banyak kerja kejuruteraan yang disesuaikan.
MCP menyokong penggabungan kemampuan pelayaran dan penalaran autonomi Deep Research, yang mempermudahkan sebahagian besar kompleksiti kepada satu konfigurasi sahaja. Pembangun kini boleh membenarkan Deep Research menggunakan carian Google, servis MCP jauh, Konteks URL, eksekusi kod, dan carian fail secara serentak—atau mematikan akses rangkaian sepenuhnya dan hanya mencari pada data tersuai.
Sistem juga menyokong input multimodal, termasuk PDF, CSV, imej, audio, dan video, sebagai grounding.
Grafik asli
Fungsi ketara kedua ialah penghasilan grafik dan infografik asli.
Versi Deep Research sebelumnya hanya boleh menghasilkan laporan teks tulen. Jika pengguna memerlukan visualisasi, mereka mesti mengimport data dan membuat grafik sendiri. Kelemahan ini sangat melemahkan kedudukan "automasi end-to-end".
Sekarang, agen generasi baru mampu menyematkan grafik dan infografik berkualiti tinggi secara asli dalam laporan, untuk merender set data kompleks secara dinamik dalam format HTML atau Google Nano Banana, menjadikannya sebahagian langsung daripada naratif analisis.
Untuk pengguna perusahaan—terutama yang berada dalam industri kewangan dan perundingan yang perlu menghasilkan hasil yang boleh terus diserahkan kepada pemangku—fungsi ini mengubah Deep Research daripada alat yang "mempercepat peringkat penyelidikan" kepada alat yang mampu menghasilkan produk analisis yang hampir akhir.

Selain itu, dengan menggabungkan fungsi perancangan kolaboratif baharu (yang membenarkan pengguna mengkaji, membimbing, dan mengoptimumkan rancangan penyelidikan agen sebelum pelaksanaan), serta output aliran masa nyata langkah-langkah penalaran sementara, sistem baharu ini membolehkan pembangun mengawal lingkup penyelidikan dengan ketepatan halus, sambil mengekalkan tahap transparansi yang tinggi yang dikehendaki oleh industri pengawasan.
Deep Research sedang menjadi sebahagian daripada "infrastructure" yang disediakan oleh Google kepada perusahaan
Artikel blog rasmi Google dengan jelas menyatakan bahawa apabila pembangun menggunakan agen Deep Research untuk membina, mereka memanggil "infrastructure penyelidikan autonom yang sama yang menyediakan kemampuan penyelidikan untuk pelbagai produk popular milik Google, seperti Aplikasi Gemini, NotebookLM, Google Search, dan Google Finance." Ini menunjukkan bahawa agen yang disediakan melalui API bukan versi ringkas dalam kalangan Google, tetapi sistem yang sama yang disediakan secara platform.
Proses evolusi ini berjalan dengan sangat pantas.
Google memperkenalkan Deep Research pertama kali dalam Aplikasi Gemini pada Disember 2024 sebagai fungsi untuk pengguna akhir, yang didorong oleh Gemini 1.5 Pro. Google menggambarkannya sebagai pembantu penyelidikan AI peribadi yang mampu menggabungkan maklumat web dalam beberapa minit, membantu pengguna menghemat berjam-jam masa kerja.
Pada Mac 2025, Google mengupgrader Deep Research dengan Gemini 2.0 Flash Thinking Experimental dan membukanya untuk percubaan umum. Selepas itu, ia dinaik taraf kepada Gemini 2.5 Pro Experimental, dengan Google melaporkan bahawa penilai lebih suka laporan ia berbanding pesaing dengan nisbah 2:1.
Disember 2025 merupakan titik balik penting, di mana Google melancarkan Interactions API, yang pertama kali menyediakan Deep Research secara pemrograman, didorong oleh Gemini 3 Pro, serta melancarkan benchmark DeepSearchQA secara sumber terbuka.
Model dasar yang mendorong peningkatan ini adalah Gemini 3.1 Pro, yang dilancarkan pada 19 Februari 2026. Model ini mencapai lompatan besar dalam kemampuan penalaran inti: dalam ujian ARC-AGI-2 yang menilai kemampuan model menyelesaikan corak logik baru, Gemini 3.1 Pro mendapat skor 77.1%, lebih daripada dua kali ganda Gemini 3 Pro.
