Anthropic telah melancarkan model terbaru yang boleh diakses secara awam, Opus 4.8, bersama dengan pra-pelancaran fungsi baharu bernama "Dynamic Workflows". Versi baharu ini dilancarkan hanya 41 hari selepas Opus 4.7, menunjukkan peningkatan pantas dalam tempoh kemas kini dan mencerminkan persaingan yang semakin panas di kalangan pembekal model besar.
41 hari sekali naik taraf
Opus 4.8 ialah model awam paling canggih yang dikeluarkan oleh Anthropic kini, dengan harga yang sama seperti versi Opus generasi sebelumnya. Perbezaan masa antara kemas kini ini lebih singkat berbanding sebelum ini. Sebagai perbandingan, siri Sonnet dan Haiku terkini Anthropic masing-masing telah berlalu sekitar 3 bulan dan 7 bulan sejak kemas kini terakhir.
Dalam jendela masa ini, OpenAI mengeluarkan kemas kini berkaitan Codex, dan Google juga melancarkan versi baharu Gemini Flash. Selepas persaingan luar mempercepat, Anthropic perlu mengeluarkan produk baharu dengan lebih pantas untuk menanggapi pasaran.
Menekankan pengurangan kesimpulan tanpa asas
Menurut Anthropic, Opus 4.8 masih menonjolkan prestasi terkemuka dalam ujian piawai, tetapi perubahan utama kali ini ialah cara model mengendalikan data yang salah atau tidak pasti. Dalam kenyataan pelancaran, syarikat tersebut menyatakan bahawa peserta ujian awal merasakan Opus 4.8 lebih cenderung untuk secara aktif menandakan ketidakpastian dan kurang memberikan penilaian yang tidak berasaskan.
Bridgewater juga disebutkan dalam ulasan pengguna bahawa versi baharu lebih mudah secara aktif menunjukkan masalah dalam input dan output analisis, yang sebelum ini sering memerlukan pengguna untuk mengenal pastinya sendiri.
Aliran kerja dinamik memasuki pra-paparan
Bersama dengan model baru, Dynamic Workflows yang sedang dalam peringkat pra-pelajaran turut dilancarkan. Sistem ini terutama ditujukan untuk pelaksanaan tugas yang lebih kompleks, dengan tujuan membantu model besar seperti Opus mengendalikan ratusan agen selari secara serentak untuk menyelesaikan kerja berskala besar dan berbilang langkah.
Anthropic memberikan contoh bahawa Claude Code bersama Opus 4.8 boleh menyelesaikan tugas migrasi yang meliputi ratusan ribu baris kod, berdasarkan sistem ujian yang ada, dari permulaan hingga penggabungan untuk membentuk alur yang lebih lengkap.
Mythos belum dibuka sepenuhnya
Anthropic masih belum secara rasmi melancarkan model Mythos yang lebih tinggi. Model ini telah dipaparkan secara sementara bulan lepas, yang menimbulkan kebimbangan mengenai keselamatan siber.
Namun, syarikat tersebut menunjukkan dalam pelancaran Opus 4.8 bahawa langkah-langkah keselamatan berkaitan sedang dipercepatkan, dan dijangka dalam beberapa minggu mendatang, model peringkat Mythos akan dibawa kepada lebih banyak pelanggan.
