DeepSeek tìm kiếm 300 triệu USD trong vòng huy động vốn amid sự thay đổi chiến lược

DeepSeek bắt đầu tiếp cận vốn bên ngoài.

The Information trích dẫn bốn nguồn thạo tin cho biết, DeepSeek đang tìm kiếm đợt huy động vốn bên ngoài đầu tiên ít nhất 300 triệu USD, với định giá không dưới 10 tỷ USD.

Nếu quay ngược thời gian về hai năm trước, đây gần như là một mệnh đề không hợp lý. Trong giai đoạn đó, công ty này là tồn tại phản trực giác nhất trong toàn bộ ngành AI của Trung Quốc.

Khi tất cả mọi người đều đang huy động vốn, mở rộng, nói về hệ sinh thái và cạnh tranh giành vị trí đầu vào, DeepSeek lại thực hiện một sự thu hẹp có chủ ý — không phát ngôn ra ngoài, không thường xuyên ra sản phẩm mới, không tham gia vào các câu chuyện của các đại gia, thậm chí còn giữ khoảng cách với vốn đầu tư.

Nhiều nhà đầu tư đã cố gắng tìm hiểu, và phản hồi họ nhận được gần như thống nhất: không có kế hoạch huy động vốn.

Trong một ngành công nghiệp bị chi phối mạnh bởi vốn, tư thế này dường như đi ngược lại logic công nghiệp. Nhưng chính vì vậy, DeepSeek từng được xem như một mẫu vật khác biệt, một đội ngũ nỗ lực kiểm chứng con đường "ít tài nguyên" trong thời đại AI.

Vì vậy, trong tín hiệu huy động vốn lần này, điều quan trọng thực sự không phải là số tiền hay định giá, mà là nó đã phá vỡ một tiền đề chiến lược kéo dài hai năm: DeepSeek không còn cố gắng tự cô lập mình khỏi hệ thống.

Một、Tường lửa của DeepSeek

Liang Wenheng có nguồn gốc sâu xa trong sự bài xích vốn bên ngoài.

Khoảng năm 2022, ngành định lượng liên tục bị chính sách kiềm chế, quy mô quản lý của Huanfang giảm hơn một nửa từ mức đỉnh điểm hàng trăm tỷ. Với lượng lớn cụm GPU và tiền mặt dư thừa trong tay, Liang Wenhfeng từng cân nhắc việc sử dụng sức mạnh tính toán thông qua hình thức đầu tư cổ phần hoặc hợp tác với nhà cung cấp điện toán đám mây.

Anh ấy đã tuyển riêng hai người để làm đầu tư chiến lược, xem xét một vòng các dự án công nghệ, kinh tế hạ tầng bay thấp, thiết bị thông minh, SaaS, nhưng cuối cùng không đầu tư vào dự án nào.

Lúc đó, nội bộ DeepSeek cho rằng, những gì bên ngoài có thể làm, mình cũng có thể làm được.

Tháng 7 năm 2023, DeepSeek chính thức được thành lập. Từ ngày đầu tiên, Liang Wenhfeng đã đặt ra một ranh giới cho công ty này: không chấp nhận vốn đầu tư bên ngoài, không pha loãng cổ phần, không bị ràng buộc bởi bất kỳ lịch trình thương mại hóa nào.

Điều anh ấy muốn tạo ra giống như một tổ chức nghiên cứu thuần túy, theo đuổi AGI, mở nguồn và để công nghệ tự nói lên chính nó.

Sự tự tin đến từ những điều thực tế.

Năm 2019, anh ấy đã đầu tư 200 triệu nhân dân tệ để tự phát triển nền tảng đào tạo học sâu Hỏa Diệm Số Một. Hai năm sau, lại bỏ ra 1 tỷ nhân dân tệ xây dựng Hỏa Diệm Số Hai, mua số lượng lớn GPU A100 của NVIDIA, biến Hỏa Diệm trở thành một trong những công ty ít ỏi ở Trung Quốc có cụm máy tính với hàng vạn card.

Trong giai đoạn nguồn cung chip khan hiếm nhất do đại dịch, Huanfang đã dự trữ hàng hóa từ trước. Năm 2025, tỷ suất lợi nhuận cả năm của Huanfang là 56,6%, doanh thu vượt 5 tỷ nhân dân tệ.

Túi tiền của Lương Văn Phong phong phú hơn hầu hết các nhà đầu tư của các công ty khởi nghiệp AI.

Có tiền, có thẻ, có người. Tiền của các quỹ VC lại trở thành gánh nặng, mang theo các cuộc cược, áp lực định giá và những câu hỏi về thời điểm thanh khoản. Anh ấy nói rất trực tiếp: Các quỹ VC đều quản lý tiền cho các LP, đều phải kiếm lời, nên khó mà đồng thuận được.

Con đường này đạt đỉnh vào tháng 1 năm 2025. R1 được phát hành, chi phí huấn luyện khoảng 5,6 triệu USD, hiệu năng gần bằng hệ thống hàng đầu của OpenAI.

“用十分之一的钱做出同级模型”，这个故事让行业意识到一件事，顶级模型能力，并非只能通过极端的资源堆叠获得。

Tại khoảnh khắc đó, ý nghĩa của DeepSeek đã được mở rộng nhanh chóng. Nó không chỉ cung cấp một mô hình, mà còn là một khả năng — ngay cả khi không có lợi thế về tài nguyên, vẫn có thể bước vào khu vực cạnh tranh cốt lõi.

The firewall not only held firm, but also became part of the story.

Nhưng vấn đề của câu chuyện là nó cần được liên tục viết tiếp.

Hai, vết nứt đã xuất hiện

Các vết nứt không xuất hiện đột ngột, mà đã bắt đầu hình thành kể từ khi R1 được phát hành, chỉ là các tín hiệu lúc đó bị phân tán.

Con người là người đầu tiên lỏng lẻo.

Đội ngũ mô hình cấp cao có một điểm chung: các thành viên cốt lõi có giá trị thị trường rất cao, và ngay khi dự án bước vào giai đoạn nghỉ ngơi, những người này sẽ trở thành mục tiêu của toàn bộ thị trường.

Người đầu tiên được chú ý là Luo Fuli, nhà phát triển then chốt của kiến trúc V3, đã chuyển sang Xiaomi vào cuối năm 2025 để tiếp quản đội ngũ mô hình lớn MiMo. Gần như cùng thời điểm này, tác giả cốt lõi của mô hình ngôn ngữ lớn thế hệ đầu tiên, Vương Bỉnh Tuyên, đã đến Tencent; nghiên cứu viên cốt lõi về hướng đa phương thức, Nguyễn Sùng, gia nhập Yuanrong Qixing với vai trò nhà khoa học trưởng; và tác giả cốt lõi của chuỗi OCR, Ngụy Hạo Nhiên, cũng đã rời đi vào dịp Tết Nguyên Đán năm nay.

Tiếp theo là Quách Đạt Nhã. Sinh năm 1994, tiến sĩ Đại học Trung Sơn, chỉ làm việc tại DeepSeek trong hai năm nhưng đã tham gia toàn bộ quá trình phát triển hầu hết các mô hình tiêu biểu như V3, R1, Coder, Math, Prover. Thuật toán GRPO do anh đề xuất là nền tảng cốt lõi của R1, với tổng số lần trích dẫn bài báo vượt quá 37.000 lần, gần như không có đối thủ nào trong số các nhà nghiên cứu AI Trung Quốc cùng thế hệ.

Hai ngày trước, Quách Đạt Nhã gia nhập ByteDance, tập trung vào tác nhân thông minh. (Đọc thêm: Trương Nhất Minh, Tín Đạt Nhã)

Năm nhân sự cốt lõi về nghiên cứu và phát triển lần lượt rời đi trong thời gian chưa đầy một năm. Sự dịch chuyển này mang ý nghĩa vượt xa việc chỉ có người rời đi; trong phát triển mô hình, kinh nghiệm có tính phụ thuộc cao vào lộ trình, việc các thành viên cốt lõi rời đi sẽ直接影响 đến hiệu suất và nhịp độ của vòng lặp tiếp theo.

Tại sao họ đi?

Trong giới headhunter, con số được lan truyền cho biết các công ty lớn đang đưa ra mức lương cho các kỹ thuật viên cốt lõi của DeepSeek thường cao gấp hai đến ba lần mức lương hiện tại. Từ tháng 9 năm 2025, đội ngũ Seed của ByteDance đã triển khai chương trình trợ cấp quyền chọn cổ phiếu đặc biệt, cấp quyền chọn hàng tháng từ 90.000 đến 135.000 nhân dân tệ tùy theo cấp bậc, với giá thấp hơn giá mua lại nội bộ, tương đương với chiết khấu trực tiếp.

Triết lý quản lý của Lương Văn Phong gần như là một ngoại lệ trong ngành công nghệ Trung Quốc: không làm thêm giờ, không chấm công, không đặt KPI. Nhân viên thường về nhà lúc 6 hoặc 7 giờ chiều, không cần điểm danh vào buổi sáng.

Anh ấy cho rằng thời gian làm việc chất lượng cao của một người mỗi ngày khó vượt quá sáu đến tám giờ. Văn hóa này hoạt động rất tốt khi DeepSeek vẫn là một đội ngũ nhỏ, những người thông minh được trao đủ tự do và tự mình hướng tới những hướng khó nhất.

Nhưng khi có người ngoài cửa gõ cửa với một hợp đồng tổng trị giá tám chữ số, tự do sẽ không còn đủ.

Điều nguy hiểm hơn là quyền chọn mua cổ phiếu. DeepSeek chưa từng huy động vốn, không có điểm tham chiếu định giá thị trường. Bạn cam kết cổ phần cho các thành viên cốt lõi, nhưng họ cầm trên tay cũng không thể chuyển đổi thành tiền thật. Quyền chọn mua cổ phiếu của các công ty lớn có giá thực hiện, cơ chế mua lại nội bộ và kỳ vọng IPO. Bên ngoài chỉ biết DeepSeek rất có giá trị, nhưng cụ thể giá trị bao nhiêu thì không ai có thể nói rõ, nhân viên càng không biết.

Việc Quách Đạt Nhã rời đi có thể đáng để suy ngẫm hơn là sự chênh lệch lương trên giấy tờ. Anh ấy chuyển sang ByteDance để làm về agent, trong khi DeepSeek cho đến nay vẫn chưa có bất kỳ sản phẩm agent nào, thậm chí khi ra mắt R1 còn không hỗ trợ function call.

Muốn làm Agent, nhưng công ty bạn đang làm không theo hướng này, sự không phù hợp này, dù trả bao nhiêu tiền cũng không thể lấp đầy.

Cùng với việc thư giãn cùng người khác, nhịp độ sản phẩm cũng được điều chỉnh.

Thế hệ sản phẩm chủ lực tiếp theo V4 ban đầu dự kiến ra mắt vào dịp Tết Nguyên Đán, sau đó lùi sang tháng 2, rồi lại lùi sang tháng 3, và hiện tại thông tin chính thức là cuối tháng 4. Từ các thông tin công khai, có ít nhất ba lý do đan xen dẫn đến việc hoãn này.

Lớp trực tiếp nhất là đường đi công nghệ đã trải qua sự thay đổi về chất.

V4 không còn là một mô hình cơ sở chỉ nhằm mục đích tăng điểm benchmark, mà là kiến trúc MoE với một nghìn tỷ tham số, đa phương tiện bản địa, ngữ cảnh lên đến triệu token, cùng cơ chế bộ nhớ điều kiện Engram hoàn toàn mới — đây là một dự án hệ thống, độ phức tạp trong đào tạo và xác minh đã tăng lên một bậc hoàn toàn mới.

Áp lực sâu hơn đến từ gánh nặng danh tính.

DeepSeek dựa vào câu chuyện rằng họ có thể đạt đến trình độ hàng đầu với chi phí chỉ bằng một phần mười. Nếu V4 chỉ mang lại sự cải thiện nhỏ về hiệu năng nhưng làm tăng chi phí suy luận, câu chuyện hỗ trợ định giá và danh tiếng sẽ xuất hiện vết nứt. Về mặt nào đó, một V4 không đủ ấn tượng còn kém hơn là không phát hành.

Còn một khía cạnh ít được thảo luận đầy đủ: sự tối ưu hóa sâu cho chip trong nước. Nhiều nguồn tin vào đầu tháng 4 tiết lộ, V4 sẽ chạy hoàn toàn trên chip Huawei Ascend 950PR, hứa hẹn trở thành mô hình lớn cao cấp đầu tiên chạy hoàn toàn trên năng lực tính toán trong nước. Giá trị chiến lược cực kỳ cao, nhưng đây bản thân là một dự án khổng lồ độc lập, ngay lập tức tiêu tốn một lượng lớn băng thông nghiên cứu và phát triển.

Đến tháng 4 năm 2026, DeepSeek đã 15 tháng không có bản cập nhật lớn. Trong khi đó, OpenAI đã trải qua bốn đến năm vòng cải tiến, Anthropic liên tục ra mắt Claude 4.5/4.6/4.7, và các đối thủ trong nước như Zhipu, Moonshot AI, ByteDance cũng đang bứt phá mạnh mẽ ở cấp độ ứng dụng.

Mọi người đều đang tăng tốc, chỉ có DeepSeek lặng lẽ.

Khác với nhiều đội ngũ khác, DeepSeek sau R1 đã không mở rộng nhanh chóng, không đẩy mạnh thương mại hóa quy mô lớn, cũng không thực hiện các bản cập nhật liên tục.

Lúc đó, nhiều người hiểu nhịp điệu này là sự kiên định. Nhưng nhìn lại từ hôm nay, nó gần giống như một sự lựa chọn chủ động, kéo dài thời gian ở trạng thái "phòng thí nghiệm" càng lâu càng tốt.

Sự kiềm chế về bản chất là kiểm soát nhịp độ, nhưng khi môi trường bên ngoài tăng tốc tổng thể, nhịp độ sẽ không còn hoàn toàn do chính bạn quyết định.

Ba, cạnh tranh đã thay đổi một hệ thống logic mới

Nếu chỉ xem xét tình cảnh hiện tại của DeepSeek một cách riêng lẻ, dễ dàng quy kết nguyên nhân là do vấn đề nội bộ công ty. Nhưng biến số quan trọng hơn đến từ bên ngoài: trong 15 tháng qua, các chiều cạnh cạnh tranh của toàn ngành đã trải qua sự chuyển dịch lớn lao.

Trước đây, trọng tâm của cuộc cạnh tranh trong các mô hình lớn nằm ở kiến trúc, phương pháp huấn luyện và tối ưu hóa kỹ thuật. Sau năm 2026, những yếu tố mới bắt đầu chiếm ưu thế: quy mô của các cụm tính toán, mật độ nhân tài, và tốc độ phản hồi từ tầng ứng dụng. Ba yếu tố này cùng nhau quyết định tốc độ lặp lại có thể nhanh đến đâu.

Cấu trúc doanh thu của các công ty hàng đầu ở nước ngoài đã chỉ rõ hướng đi.

Anthropic đã tăng doanh thu hàng năm từ 9 tỷ USD lên 30 tỷ USD trong bốn tháng, với phần tăng trưởng gần như hoàn toàn đến từ Claude Code — một tác nhân lập trình. Cursor, một trình chỉnh sửa mã, định giá 60 tỷ USD. GitHub Copilot đã phủ sóng 20 triệu nhà phát triển.

Tiền đang chảy vào các sản phẩm có thể trực tiếp tạo ra mã, công cụ và ứng dụng.

Các đối thủ trong nước cũng đang nhanh chóng lấp đầy khoảng trống, ByteDance, Alibaba và Tencent đều đã triển khai các dòng sản phẩm Coding và Agent; API của Zhipu và Moonshot đã bị quá tải trong cơn sốt tôm hùm đầu năm, chính xác vì những khoản đầu tư của họ vào hướng Coding.

Rõ ràng, năng lực của mô hình điểm đơn vẫn quan trọng, nhưng không còn là yếu tố quyết định duy nhất. Tài nguyên, tổ chức và năng lực hệ thống bắt đầu trở thành các biến số then chốt. Trong năm qua, các hành động của vài công ty hàng đầu Trung Quốc có lộ trình khác nhau nhưng hướng đi nhất quán, tích hợp năng lực mô hình vào một hệ thống lớn hơn.

DeepSeek có lượng người theo dõi lớn nhất trong cộng đồng mã nguồn mở toàn cầu, với 170.000 sao trên GitHub, 26.000 tài khoản doanh nghiệp và 5,7 tỷ lần gọi API mỗi tháng. Tuy nhiên, nó không có IDE riêng, không có công cụ Coding, không có sản phẩm Agent và không có ứng dụng trực tiếp dành cho người dùng cuối để họ trả tiền.

Liang Wenfeng luôn kiên trì rằng mô hình là nền tảng của mọi thứ.

Hướng nghiên cứu trong các bài báo gần đây của anh ấy — cơ chế bộ nhớ có điều kiện và tối ưu hóa siêu kết nối Transformer — cho thấy DeepSeek vẫn tập trung vào việc giải quyết các vấn đề nền tảng. Sự kiên trì này đã được kiểm chứng trong thời kỳ R1, khi họ sử dụng ít tiền và nhân lực nhất để đạt đến mức tối ưu các năng lực cơ bản, và để lại phần còn lại cho hệ sinh thái mã nguồn mở.

Nhưng khi cạnh tranh mở rộng từ năng lực mô hình cơ bản sang so sánh đồng thời về năng lực + sản phẩm + hệ sinh thái, thì chỉ có động cơ mà không có xe nguyên chiếc, dù mạnh đến đâu cũng không thể chạy được.

Vào buổi tối ngày 29 tháng 3, DeepSeek đã trải qua sự cố gián đoạn dịch vụ kéo dài nhất kể từ khi ra mắt, vượt quá 7 giờ, ảnh hưởng đến hàng trăm triệu người dùng. Công ty không giải thích nguyên nhân. Trong thời gian gián đoạn, lưu lượng truy cập của đối thủ cạnh tranh tăng rõ rệt, một số khách hàng doanh nghiệp bắt đầu xem xét chiến lược dự phòng đa nền tảng.

Một lần ngừng hoạt động không thể giết chết một công ty, nhưng nó đã đưa một sự thật lên bề mặt. Khi số lượng người dùng tăng từ triệu lên tỷ, đầu tư vào hạ tầng không còn có thể được bù đắp chỉ bằng tối ưu hóa hiệu suất.

Lợi nhuận của Huanfang đủ để duy trì, nhưng không đủ để thoải mái.

Bốn trăm triệu đô la Mỹ mua gì?

300 triệu USD so với định giá 10 tỷ USD, tỷ lệ pha loãng dưới 3%. So với các ông lớn như Anthropic và OpenAI, con số này thậm chí còn cực kỳ khiêm tốn.

Điều mà Lương Văn Phong thực sự muốn mua có thể không nằm trên bảng cân đối kế toán.

Trước hết, quyền chọn cuối cùng cũng đã có điểm tham chiếu. Khi định giá 10 tỷ USD được xác nhận, cổ phần trong tay đội ngũ cốt lõi đã trở thành tiền thật. Đối với một đội ngũ đang bị từng công ty lớn lần lượt đào tạo, tín hiệu này hiệu quả hơn bất kỳ kế hoạch tăng lương nào; ở giai đoạn hiện tại, việc ngăn chặn tình trạng thất thoát nhân tài là vô cùng quan trọng.

Thứ hai, đây là quỹ bảo hiểm của V4.

Việc tối ưu hóa đầy đủ cho Huawei Ascend bản thân đã tiêu tốn nhiều tài nguyên, trong khi các báo cáo truyền thông cho biết DeepSeek cũng đang sử dụng chip Blackwell thế hệ mới nhất của NVIDIA để huấn luyện mô hình thế hệ tiếp theo, và chip này bị ảnh hưởng bởi các hạn chế xuất khẩu, khiến tiến độ tiếp cận trở nên không chắc chắn. Hai tuyến phần cứng song song đang được triển khai, làm gia tăng đáng kể chi phí vốn.

Lớp tinh vi nhất là đây là vé vào hiệp hai.

Cuộc cạnh tranh AI đã bước vào giai đoạn được thúc đẩy bởi bốn yếu tố: mô hình, sản phẩm, hệ sinh thái và vốn. Bạn có thể sở hữu động cơ tốt nhất thế giới, nhưng nếu không có sự hậu thuẫn về vốn và hệ sinh thái sản phẩm, cuối cùng bạn chỉ là một nhà cung cấp cấp cao trong chuỗi công nghiệp, nhìn người khác kiếm tiền từ mô hình của bạn.

Từ hướng phát triển của V4, Liang Wenheng có lẽ đã nhận ra điều này. Nhiều nguồn tin cho thấy kế hoạch của V4 rõ ràng bao gồm sự bứt phá lớn về khả năng tìm kiếm AI, trí nhớ dài hạn và khả năng mã hóa — những năng lực nền tảng của thời đại Agent.

DeepSeek đang bù bài. Huy động vốn là để đảm bảo môn học này có thể hoàn thành kịp thời.

[Ngoài giao diện]

Ngoài trời dễ dàng hiểu sự chuyển hướng này là sự nhượng bộ. Nhưng nhìn từ một góc độ khác, nó gần giống như một sự tiến hóa từ trạng thái thí nghiệm sang trạng thái công nghiệp.

Đường cong chi phí của ngành AI đã tăng đột biến, lạm phát nhân tài vượt quá mọi kỳ vọng. Việc dựa vào phong cách cá nhân và nguồn lợi nhuận đơn lẻ để duy trì một siêu独角兽 ngày càng trở nên không thực tế.

Liang Wenheng đã có những lựa chọn mang tính logic: kiểm soát quy mô, tránh thương mại hóa quá sớm và duy trì sự tinh khiết trong nghiên cứu và phát triển. Những lựa chọn này mang lại sức bật mạnh mẽ trong giai đoạn nhất định, nhưng nhịp độ của ngành cuối cùng sẽ tạo ra sự ràng buộc đối với tất cả mọi người.

300 triệu USD, đó là lần đầu tiên Liang Wenheng công khai thừa nhận điều này.

Bài viết này đến từ tài khoản chính thức WeChat “Bản diện ngoài”, tác giả: Hua Hua