Anthropic meluncurkan model publik generasi baru Opus 4.8, sekaligus merilis pratinjau fitur baru bernama "Dynamic Workflows". Versi baru ini dirilis hanya 41 hari setelah Opus 4.7, menunjukkan percepatan ritme pembaruan dan meningkatnya persaingan di antara pabrikan model besar dalam pengembangan produk.
Upgrade dilakukan setiap 41 hari
Opus 4.8 adalah model publik paling canggih yang saat ini dirilis oleh Anthropic, dengan harga yang tetap sama dengan versi Opus generasi sebelumnya. Perbedaan waktu pembaruan kali ini lebih singkat dibandingkan sebelumnya. Sebagai perbandingan, seri Sonnet dan Haiku terbaru dari Anthropic masing-masing telah berlalu sekitar 3 bulan dan 7 bulan sejak pembaruan terakhir.
Dalam jendela waktu ini, OpenAI meluncurkan pembaruan terkait Codex, dan Google juga merilis versi baru Gemini Flash. Setelah persaingan eksternal mempercepat, Anthropic perlu segera menghadirkan produk baru sebagai respons terhadap pasar.
Tekankan pengurangan kesimpulan tanpa dasar
Menurut Anthropic, Opus 4.8 tetap menonjol dalam kinerja benchmark terdepan, tetapi perubahan utama kali ini terletak pada cara model menangani data yang salah atau tidak pasti. Dalam keterangan rilisnya, perusahaan menyatakan bahwa pengujian awal menunjukkan Opus 4.8 cenderung lebih aktif menandai ketidakpastian dan lebih jarang memberikan penilaian yang tidak didukung bukti.
Bridgewater Associates juga disebutkan dalam ulasan pengguna bahwa versi baru lebih mudah secara aktif menunjukkan masalah dalam input dan output analisis, yang sebelumnya sering kali harus ditemukan oleh pengguna sendiri.
Workflow dinamis memasuki pra-pandangan
Bersamaan dengan peluncuran model baru, Dynamic Workflows yang masih dalam tahap pra-penelitian juga dirilis. Sistem ini terutama dirancang untuk eksekusi tugas yang lebih kompleks, dengan tujuan membantu model besar seperti Opus mengoordinasikan ratusan agen paralel untuk menyelesaikan pekerjaan besar dan multi-langkah.
Anthropic memberikan contoh bahwa Claude Code yang dipadukan dengan Opus 4.8 dapat menyelesaikan tugas migrasi yang mencakup ratusan ribu baris kode, berdasarkan sistem pengujian yang ada, dari awal hingga penggabungan membentuk alur yang lebih lengkap.
Mythos belum dibuka sepenuhnya
Anthropic hingga kini belum secara resmi meluncurkan model Mythos tingkat lebih tinggi. Model ini sempat dirilis secara preview bulan lalu, yang memicu kekhawatiran terkait keamanan siber.
Namun, perusahaan menyatakan dalam rilis Opus 4.8 ini bahwa perlindungan keamanan terkait sedang dipercepat, dan diharapkan dalam beberapa minggu mendatang dapat membawa model tingkat Mythos kepada lebih banyak pelanggan.
