DeepSeek Mencari Pendanaan $300J Amid Perubahan Strategik

DeepSeek mula berhubung dengan modal luar.

The Information mengutip empat sumber yang berpengetahuan mengatakan bahawa DeepSeek sedang mencari pendanaan luar pertama sekurang-kurangnya 300 juta dolar AS, dengan penilaian tidak kurang daripada 10 bilion dolar AS.

Jika kita memutar semula masa dua tahun ke belakang, ini hampir merupakan pernyataan yang tidak munasabah. Pada masa itu, syarikat ini adalah kehadiran paling bertentangan dengan akal dalam industri AI China keseluruhan.

Apabila semua orang sedang membiayai, mengembangkan, bercerita tentang ekosistem, dan merebut akses, DeepSeek justru melakukan pengekangan yang disengaja—tidak bersuara ke luar, tidak sering melancarkan produk, tidak terlibat dalam naratif syarikat besar, bahkan menjaga jarak dari modal.

Banyak pelabur telah mencuba untuk mendekati, dan umpan balik yang diterima hampir seragam: tiada rancangan pembiayaan.

Dalam industri yang sangat didorong oleh modal, sikap ini kelihatan bertentangan dengan logik industri. Tetapi justeru kerana itu, DeepSeek pernah dianggap sebagai sampel asing, sebuah pasukan yang cuba menguji "jalan sumber rendah" di era AI.

Jadi, dalam isyarat pembiayaan ini, yang benar-benar penting bukanlah jumlahnya, bukan pula penilaian, tetapi ia memecahkan satu anggapan strategi yang berlangsung selama dua tahun: DeepSeek tidak lagi berusaha mengasingkan dirinya dari sistem.

Satu: Perisai API DeepSeek

Liang Wenhong memiliki akar yang mendalam terhadap penolakan terhadap modal luar.

Pada sekitar tahun 2022, industri kuantitatif terus mengalami tekanan politik, dan skala pengurusan Huafang berkurang separuh daripada puncaknya yang mencapai seribu miliar. Dengan mengendalikan banyak cluster GPU dan tunai yang berlebihan, Liang Wenheng pernah mempertimbangkan untuk mengeluarkan kekuatan pengiraan melalui pelaburan atau kerjasama dengan penyedia awan.

Dia secara khusus merekrut dua orang untuk melakukan pelaburan perang, memeriksa pelbagai projek teknologi seperti ekonomi udara rendah, peranti pintar, dan SaaS, tetapi akhirnya tidak melabur dalam mana-mana satu pun.

Pada masa itu, penilaian dalaman DeepSeek ialah, apa yang boleh dilakukan oleh pihak luar, mereka juga mampu melakukannya.

Pada Julai 2023, DeepSeek secara rasmi ditubuhkan. Liang Wenfeng menetapkan satu garisan bagi syarikat itu sejak hari pertama: tidak menerima pendanaan luar, tidak melemahkan saham, dan tidak dipengaruhi oleh jadual komersial siapa pun.

Barang yang ingin dia bina lebih menyerupai sebuah institut penyelidikan tulen, yang mengejar AGI, membuat sumber terbuka, dan membiarkan teknologi berbicara sendiri.

Keyakinan adalah nyata.

Pada tahun 2019, beliau menghabiskan 200 juta yuan untuk mengembangkan platform pelatihan pembelajaran mendalam sendiri, Firefly I. Dua tahun kemudian, beliau menginvestasikan 1 miliar yuan untuk membangun Firefly II, membeli sejumlah besar NVIDIA A100, menjadikan Huanfang sebagai salah satu dari sedikit perusahaan di Tiongkok dengan kluster berbasis sepuluh ribu kartu.

Pada masa kekurangan bekalan cip semasa pandemi, Qianfang telah mengumpul stok terlebih dahulu. Pada tahun 2025, hasil tahunan Qianfang ialah 56.6%, dengan pendapatan melebihi 5 miliar yuan Tiongkok.

Dompet Liang Wenfeng lebih kaya berbanding kebanyakan pelabur syarikat permulaan AI.

Ada wang, ada kad, ada orang. Wang VC justru menjadi beban, dengan tekanan pertaruhan, tekanan penilaian, dan pertanyaan kapan akan mencairkan. Dia berkata dengan jujur: VC semuanya mengurus wang LP, semuanya perlu untung, jadi tidak pernah sejalan.

Jalan ini mencapai puncaknya pada Januari 2025. R1 dilancarkan, dengan kos latihan sekitar $5.6 juta, dan prestasi hampir menyamai sistem teratas OpenAI.

"Menggunakan sepuluh peratus daripada wang untuk menghasilkan model setara," kisah ini membuat industri sedar bahawa kemampuan model teratas tidak semestinya hanya boleh dicapai melalui pengumpulan sumber yang ekstrem.

Pada saat itu, makna DeepSeek dipertingkatkan dengan cepat. Ia bukan sahaja menyediakan satu model, tetapi satu kemungkinan, di mana seseorang masih boleh memasuki zon persaingan utama walaupun tidak memiliki sumber yang unggul.

Firewall tidak hanya berdiri tegak, tetapi juga menjadi sebahagian daripada cerita itu.

Tetapi masalah cerita ini ialah ia perlu diteruskan secara berterusan.

Dua, retak telah muncul

Retak bukan muncul secara tiba-tiba, ia bermula tumbuh selepas pengeluaran R1, tetapi isyarat pada masa itu adalah tersebar.

Manusia adalah yang pertama kali longgar.

Timm model teratas mempunyai ciri umum, ahli inti mempunyai nilai pasaran yang sangat tinggi, dan apabila projek memasuki tempoh jeda, orang-orang ini akan menjadi sasaran seluruh pasaran.

Yang pertama kali diperhatikan ialah Luo Fuli, pengembang utama arsitektur V3, yang berpindah ke Xiaomi pada akhir 2025 untuk mengambil alih pasukan model besar MiMo. Pada masa yang hampir bersamaan, Wang Bingxuan, penulis utama model bahasa besar generasi pertama, pergi ke Tencent; Ruan Chong, penyelidik utama arah multimodal, menyertai Yuanlong Qixing sebagai saintis utama; dan Wei Haoran, penulis utama siri OCR, juga meninggalkan syarikat pada sekitar Cuti Tahun Baru Cina tahun ini.

Kemudian ada Guo Daya. Dilahirkan pada tahun 1994, memegang gelar doktor dari Universiti Sun Yat-sen, hanya berada di DeepSeek selama dua tahun, tetapi terlibat sepenuhnya dalam pembangunan hampir semua model penting seperti V3, R1, Coder, Math, dan Prover. Algoritma GRPO yang dicadangkannya merupakan dasar teknologi utama R1, dengan jumlah petikan kertasnya melebihi 37,000 kali—hampir tidak ada pesaing di kalangan ahli AI Tiongkok sebaya dengannya.

Dua hari yang lalu, Guo Daya menyertai ByteDance dengan fokus pada agen pintar. (Baca lanjutan: Zhang Yiming, Xin Da Ya)

Lima orang kakitangan utama penyelidikan dan pembangunan berpindah secara berturut-turut dalam masa kurang dari setahun. Pergerakan ini bermakna lebih daripada sekadar kepergian individu; dalam pembangunan model, pengalaman sangat bergantung kepada laluan, dan kepergian ahli utama akan直接影响 kecekapan dan ritma iterasi seterusnya.

Mengapa mereka pergi?

Angka yang beredar di kalangan perusahaan rekrutmen menyatakan bahawa syarikat besar menawarkan teknisi utama DeepSeek gaji dua hingga tiga kali ganda gaji asal mereka. Sejak September 2025, pasukan Seed Byte telah melancarkan tunjangan opsyen khas, yang memberikan opsyen sebanyak RM90,000 hingga RM135,000 sebulan mengikut peringkat jawatan, dengan harga di bawah harga beli semula dalaman, bermakna diskaun terus.

Falsafah pengurusan Liang Wenfeng hampir menjadi pengecualian dalam industri teknologi China: tiada lembur, tiada tanda masuk, tiada KPI. Pekerja pulang pada pukul 6 atau 7 petang, dan tidak perlu daftar masuk pada pagi hari.

Dia percaya masa kerja berkualiti tinggi seseorang dalam sehari sukar melebihi enam hingga lapan jam. Budaya ini berfungsi dengan baik ketika DeepSeek masih merupakan pasukan kecil, di mana orang yang bijak diberi kebebasan yang mencukupi, dan mereka sendiri akan menerjang ke arah yang paling sukar.

Tetapi apabila seseorang di luar mengetuk pintu dengan jumlah total angka delapan digit, kebebasan tidak lagi mencukupi.

Yang lebih mematikan ialah pilihan saham. DeepSeek tidak pernah mendapat pendanaan, tiada titik rujukan penilaian pasaran. Anda memberi janji saham kepada ahli utama, tetapi mereka tidak boleh menukarkannya kepada wang tunai yang sebenar. Pilihan saham syarikat besar mempunyai harga pelaksanaan, mekanisme beli semula dalaman, dan jangkaan IPO. Orang luar hanya tahu DeepSeek sangat bernilai, tetapi berapa tepat nilainya, tiada siapa yang boleh nyatakan, apalagi pekerja.

Kehilangan Guo Daya mungkin lebih patut dipertimbangkan daripada perbezaan gaji yang nampak. Dia pergi ke ByteDance untuk bekerja dalam agen, sedangkan DeepSeek sehingga kini tidak mempunyai sebarang produk Agen, dan pada masa pelancaran R1, ia bahkan tidak menyokong function call.

Ingin menjadi agen, tetapi syarikat anda tidak bergerak dalam arah ini, ketidakselarasan ini tidak boleh diisi dengan seberapa banyak wang pun.

Dengan orang lain, ritme produk juga longgar.

Versi unggulan generasi berikutnya V4 awalnya dijadwalkan dilancarkan menjelang dan selepas Tahun Baru Cina, ditunda ke Februari, kemudian ke Mac, dan kini versi rasmi menyatakan akhir April. Berdasarkan maklumat awam, penundaan ini sekurang-kurangnya disebabkan oleh tiga faktor yang saling berkaitan.

Tahap paling langsung ialah jalan teknikal itu sendiri mengalami perubahan kualitatif.

V4 tidak lagi sekadar model asas yang memburu benchmark, tetapi arsitektur MoE dengan triliunan parameter, multimodal asli, konteks token sehingga jutaan, dan mekanisme ingatan bersyarat Engram yang baru — ini adalah rekabentuk sistem, dan kompleksiti latihan serta pengesahan meningkat secara drastis.

Tekanan yang lebih mendalam datang dari beban identiti.

DeepSeek berdiri berdasarkan cerita bahawa ia mampu mencapai prestasi teratas dengan kos sepuluh peratus sahaja. Jika V4 hanya menunjukkan peningkatan kecil dalam prestasi tetapi meningkatkan kos inferens, cerita yang menyokong penilaian dan reputasinya akan retak. Dalam beberapa segi, V4 yang tidak terlalu mengesankan lebih baik tidak dikeluarkan sama sekali.

Masih ada satu lapisan yang jarang dibincangkan secara mencukupi: penyesuaian mendalam terhadap cip tempatan. Sumber-sumber pelbagai mengungkap pada awal April bahawa V4 akan berjalan sepenuhnya di atas cip Huawei Ascend 950PR, berpotensi menjadi model besar unggul pertama yang berjalan sepenuhnya di atas kuasa komputasi tempatan. Nilai strategiknya sangat tinggi, tetapi ini sendiri merupakan projek raksasa yang berdiri sendiri, yang secara langsung menyerap sebahagian besar bandwidth pengembangan.

Pada April 2026, DeepSeek belum mengeluarkan kemasukan versi besar selama 15 bulan. Semasa ini, OpenAI telah mengembangkan empat hingga lima versi, Anthropic terus melancarkan Claude 4.5/4.6/4.7, dan rakan seindustry di dalam negara seperti Zhipu, Moonshot, dan ByteDance juga sedang maju pantas di peringkat aplikasi.

Semua orang sedang mempercepat, hanya DeepSeek yang tenang.

Berbeza dengan banyak pasukan, DeepSeek tidak memperluas dengan cepat selepas R1, tidak mendorong komersialisasi berskala besar, dan tidak melakukan kemas kini versi yang rapat.

Pada masa itu, banyak orang memahami ritme ini sebagai ketabahan. Tetapi dari perspektif hari ini, ia lebih mendekati pilihan aktif untuk memperpanjang masa "keadaan makmal" sebanyak mungkin.

Menjaga kesabaran pada dasarnya adalah mengawal ritme, tetapi apabila persekitaran luar keseluruhan mempercepat, ritme tidak lagi sepenuhnya di bawah kawalan anda.

Tiga, persaingan menggunakan logik yang berbeza

Jika melihat situasi semasa DeepSeek secara berasingan, ia mudah dianggap sebagai masalah dalaman syarikat. Namun, pemboleh ubah yang lebih penting datang dari luar, selama 15 bulan terakhir, dimensi persaingan keseluruhan industri telah mengalami perubahan besar.

Pada masa yang lebih awal, inti persaingan model besar terletak pada arsitektur, kaedah latihan, dan pengoptimuman kejuruteraan. Selepas 2026, perkara baru mulai mendominasi: skala kolam komputasi, kepadatan bakat, dan kelajuan umpan balik lapisan aplikasi. Ketiga-tiganya secara bersama-sama menentukan seberapa pantas iterasi boleh berjalan.

Struktur pendapatan syarikat terkemuka luar negara telah menunjukkan arahannya.

Pendapatan tahunan Anthropic meningkat dari US$9 bilion menjadi US$30 bilion dalam empat bulan, dengan hampir semua pertumbuhan datang daripada agen pemrograman Claude Code. Cursor, sebuah editor kod, dinilai pada US$60 bilion. GitHub Copilot menjangkau 20 juta pembangun.

Dana mengalir ke produk yang secara langsung menghasilkan kod, alat, dan aplikasi.

Rakan sejajar di dalam negara juga sedang dengan cepat mengisi ruang tersebut, ByteDance, Alibaba, dan Tencent masing-masing telah meluncurkan lini produk Coding dan Agent, API dari Zhipu dan Moonshot telah dilanda permintaan tinggi semasa gelombang udang rebus awal tahun, tepatnya kerana penekanan mereka pada arah Coding.

Jelas bahawa kemampuan model titik tunggal masih penting, tetapi bukan lagi faktor penentu tunggal. Sumber daya, organisasi, dan kemampuan sistem mulai menjadi pemboleh ubah utama. Pergerakan beberapa syarikat terkemuka di China dalam setahun terakhir berbeza dalam lintasan, tetapi arahnya seragam, iaitu memasukkan kemampuan model ke dalam sistem yang lebih besar.

DeepSeek memiliki populariti tertinggi di komuniti sumber terbuka global, dengan 170.000 bintang di GitHub, 26.000 akaun perusahaan, dan 57 miliar panggilan API setiap bulan. Namun, ia tidak mempunyai IDE sendiri, alat Coding, produk Agent, atau aplikasi vertikal yang pengguna akhir membayar secara langsung.

Leung Man Fung terus berpegang teguh bahawa model adalah asas segalanya.

Arah kertas terbaru yang ditandatanganinya, mekanisme ingatan bersyarat dan pengoptimuman hyperconnection Transformer, menunjukkan bahawa perhatian DeepSeek masih tertumpu pada penyelesaian masalah asas. Ketekunan ini telah disahkan semasa era R1, dengan menggunakan sedikit wang dan tenaga kerja untuk mencapai keupayaan asas secara maksimum, sementara yang lain diserahkan kepada ekosistem sumber terbuka.

Tetapi apabila persaingan berkembang dari kemampuan model asas kepada perbandingan serentak terhadap kemampuan + produk + ekosistem, tanpa kereta keseluruhan walaupun enjinnya paling kuat, ia tidak akan boleh bergerak.

Pada malam 29 Mac, DeepSeek mengalami gangguan perkhidmatan terpanjang sejak pelancarannya, melebihi 7 jam, yang mempengaruhi ratusan juta pengguna. Pihak rasmi tidak memberikan penjelasan mengenai sebabnya. Semasa gangguan, trafik pesaing meningkat ketara, dan beberapa pelanggan korporat mula mempertimbangkan strategi redundansi pelbagai platform.

Satu kali gangguan tidak akan membunuh sebuah syarikat, tetapi ia membawa satu fakta ke depan. Apabila pengguna meningkat dari jutaan kepada miliaran, pelaburan dalam infrastruktur tidak lagi boleh ditangani hanya dengan pengoptimuman kecekapan.

Keuntungan Huanfang mampu bertahan, tetapi tidak dengan tenang.

Empat ratus juta dolar AS membeli apa?

Dilusi kurang daripada 3% berbanding penilaian sebanyak 10 miliar dolar AS. Berbanding raksasa-raksasa seperti Anthropic dan OpenAI, nombor ini bahkan kelihatan sangat terkawal.

Barang yang sebenarnya ingin dibeli oleh Liang Wenfeng mungkin tidak terdapat dalam penyata kewangan.

Pertama-tama, pilihan akhirnya memiliki titik tumpu. Setelah penetapan harga 10 miliar dolar AS dikonfirmasi, saham yang dipegang oleh tim inti menjadi uang sungguhan. Bagi tim yang sedang digaet satu per satu oleh perusahaan besar, sinyal ini lebih efektif daripada apa pun program kenaikan gaji; pada tahap ini, menghentikan kebocoran bakat sangat penting.

Kedua, ini adalah dana insurans V4.

Penuh penyesuaian Huawei Ascend sendiri sudah menghabiskan sumber daya, sambil media melaporkan bahawa DeepSeek juga menggunakan cip Blackwell terbaru NVIDIA untuk melatih model generasi seterusnya, dan cip ini menghadapi ketidakpastian dalam pengambilan akibat sekatan eksport. Dua jalan peranti yang berjalan serentak telah memperbesarkan penggunaan dana secara ganda.

Tingkat yang paling halus ialah, ini adalah tiket masuk ke separuh masa kedua.

Pertandingan AI telah memasuki tahap yang didorong oleh empat pilar: model, produk, ekosistem, dan modal. Anda boleh memiliki enjin terbaik di dunia, tetapi tanpa sokongan modal dan ekosistem produk, anda akhirnya hanyalah pembekal tingkat tinggi dalam rantai nilai, memandang orang lain mendapat keuntungan daripada model anda.

Dari arah pembangunan V4, Liang Wenfeng kemungkinan sudah menyedari perkara ini. Sumber-sumber pelbagai menunjukkan bahawa perancangan V4 secara jelas merangkumi peningkatan besar dalam carian AI, memori jangka panjang, dan kemampuan kod, yang semuanya merupakan kemampuan asas era Agent.

DeepSeek sedang mengulang pelajaran. Pembiayaan dilakukan agar kursus ini boleh selesai pada masanya.

【Di luar tata letak】:

Pihak luar mudah memahami peralihan ini sebagai kompromi. Tetapi dari sudut pandang lain, ia lebih mendekati evolusi dari keadaan eksperimen ke keadaan industri.

Lengkung kos industri AI telah meningkat tajam, dan inflasi bakat melampaui semua jangkaan. Semakin tidak realistik untuk bergantung pada gaya peribadi dan sumber keuntungan tunggal untuk menanggung sebuah super unicorn.

Pilihan梁文锋 di masa lalu mempunyai logikanya sendiri: mengawal skala, mengelakkan komersialisasi terlalu awal, dan mengekalkan kemurnian penyelidikan dan pembangunan. Pilihan seperti ini sangat berkuasa pada peringkat tertentu, tetapi ritme industri akhirnya akan memberi batasan kepada semua orang.

300 juta dolar AS, merupakan kali pertama Liang Wenhfeng mengakui perkara ini secara terbuka.

Artikel ini berasal daripada akaun微信公众号 “Di Luar Halaman”, penulis: Hua Hua