DeepSeek V4 API Meluncurkan Model Flash dan Pro dengan Pemotongan Harga dan Ekspansi Konteks 8x

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
API DeepSeek V4 meluncurkan model V4-Pro dan V4-Flash pada 24 April (UTC+8), dengan harga yang diperbarui dan konteks yang diperluas. V4-Flash menggantikan V3.2 dengan biaya input 50% lebih rendah dan biaya output 33% lebih rendah. Panjang konteks meningkat dari 128K menjadi 1 juta token. V4-Pro, model tier atas baru, harganya 8 kali lebih mahal daripada V3.2 dalam harga output. DeepSeek memperkirakan harga akan turun pada H2 dengan node Ascend 950. Pergerakan harga kripto dan sentimen pasar, seperti yang tercermin dalam indeks fear and greed, dapat memengaruhi adopsi model-model baru ini.

Berita ME, 24 April (UTC+8), menurut pemantauan Beating, API DeepSeek V4 telah secara bersamaan meluncurkan V4-Pro dan V4-Flash, dengan harga dan rencana daya komputasi diumumkan di akun resmi WeChat. V4-Flash secara langsung menggantikan V3.2 (deepseek-chat), tidak hanya tidak meningkatkan harga, tetapi juga menurunkannya: input dengan cache hit tetap di 0,2 yuan per juta token, input dengan cache miss turun dari 2 yuan menjadi 1 yuan (turun 50%), dan output turun dari 3 yuan menjadi 2 yuan (turun 33%). Konteks diperluas dari 128K menjadi 1M, artinya Anda mendapatkan konteks 8 kali lebih panjang dengan harga yang lebih murah. Nama model lama deepseek-chat dan deepseek-reasoner akan dihentikan pada 24 Juli 2026, saat ini masing-masing mengarah ke mode non-reasoning dan mode reasoning dari V4-Flash. V4-Pro adalah lini baru kelas atas: input dengan cache hit 1 yuan, cache miss 12 yuan, output 24 yuan per juta token—harga output adalah 8 kali lipat dari V3.2. DeepSeek menjelaskan dalam catatan tabel harga bahwa layanan Pro saat ini sangat terbatas karena keterbatasan daya komputasi kelas atas, dan diperkirakan harga Pro akan turun signifikan setelah node super Ascend 950 mulai diproduksi massal pada paruh kedua tahun ini. Kedua model mendukung mode non-reasoning dan mode reasoning, dengan mode reasoning mendukung pengaturan parameter reasoning_effort pada dua tingkat: high dan max. DeepSeek menyatakan dalam pengumumannya: "Mulai sekarang, konteks 1M akan menjadi standar bawaan untuk semua layanan resmi DeepSeek." (Sumber: BlockBeats)

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.