DeepSeek giảm vĩnh viễn giá API giữa lúc chi phí AI tăng cao

icon MarsBit
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
DeepSeek đã giảm vĩnh viễn giá API V4-Pro đi 75%, với giá đầu vào là 0,435 USD mỗi triệu token và đầu ra là 0,87 USD. Giá cho lần truy cập bộ nhớ đệm đầu vào hiện ở mức 0,003625 USD mỗi triệu token. Công ty, được biết đến với tên gọi "Pinduoduo của AI", đang thu hút sự chú ý từ các altcoin cần theo dõi khi đẩy mạnh chiến lược định giá aggresive. Người sáng lập Liang Wenfeng được cho là đang huy động 20 tỷ Nhân dân tệ trong vòng tài trợ A. Tỷ lệ cấp vốn vẫn là chỉ số quan trọng khi giá AI toàn cầu tăng, trong khi OpenAI và Anthropic cũng đang tăng chi phí.

Bài viết | Kênh Luo Chao

DeepSeek thông báo sẽ vĩnh viễn hóa mức chiết khấu 75% cho API V4-Pro, có hiệu lực đồng thời trên toàn cầu.

Hệ thống giá cuối cùng: Giá đầu vào cơ bản giảm từ 1,74 USD / triệu token xuống 0,435 USD / triệu token, giá đầu ra giảm từ 3,48 USD / triệu token xuống 0,87 USD / triệu token. Đối với các lần truy cập bộ nhớ đệm đầu vào trên toàn bộ dòng sản phẩm API, DeepSeek đã áp dụng mức chiết khấu lớn hơn nhiều: 0,003625 USD / triệu token, hoàn toàn theo mô hình giá sàn kiểu Pinduoduo.

Liang Wenfeng

Ngay lập tức, các nền tảng truyền thông xã hội bao gồm X tràn ngập những lời khen: Lương Văn Phong chính là Bồ Tát cyber, Phong Thần, Lương Thánh. Cảm xúc này không xuất phát từ giá rẻ本身—DeepSeek luôn được gọi là “Pinduoduo của AI”, miễn phí cho người dùng cá nhân, giá rẻ cho doanh nghiệp, cả thế giới đã quen với mức giá rẻ của nó, nhưng khó khăn trong đợt giảm giá lần này nằm ở chỗ: toàn bộ ngành AI trên thế giới đều đang tăng giá.

Có báo cáo cho rằng, Lương Văn Phong sẽ tự bỏ ra tối đa 20 tỷ nhân dân tệ trong đợt huy động vốn vòng A kỷ lục mà DeepSeek đang tiến hành, chiếm 40% tổng số vốn huy động. Hầu hết các công ty khi huy động vốn đều ưu tiên tăng dòng tiền để cải thiện báo cáo tài chính, nhưng Lương Văn Phong không định dùng những lời hứa thương mại để thu hút nhà đầu tư, mà kiên trì với mô hình mã nguồn mở và theo đuổi AGI—đợt giảm giá này thực sự là làm đến nơi đến chốn. Lần gần nhất có người dám công khai không muốn kiếm tiền là Pinduoduo, khi đồng sáng lập của công ty này trong cuộc gọi với nhà đầu tư năm 2024 đã rõ ràng tuyên bố: “Từ quý 3 trở đi, lợi nhuận của chúng tôi sẽ dần giảm và không phục hồi trong ngắn hạn. Về lâu dài, sự suy giảm khả năng sinh lời là không thể tránh khỏi.” Giá cổ phiếu lập tức sụp đổ.

Sam Altman luôn nói về việc dân chủ hóa AI, nhưng công ty OpenAI đang nhanh chóng đi ngược lại với tên gọi của nó: CloseAI. Trong khi đó, Liang Wenheng đang nỗ lực thực tế để giúp mọi người và mọi doanh nghiệp tiếp cận AI một cách phổ cập nhất có thể. Nhưng Liang Wenheng có phải là một vị Bồ Tát sống không? Không phải. Anh ấy là một doanh nhân, và việc mở nguồn và phổ cập chỉ là sự lựa chọn mô hình kinh doanh—điều này hiện nay rất quý giá và trong tương lai sẽ ngày càng khan hiếm.

Vì: AI đang ngày càng đắt đỏ hơn.

Tuần này, Microsoft đã hủy giấy phép Claude Code nội bộ vì chi phí tính theo token quá cao khiến họ không chịu nổi. Microsoft từng đầu tư mạnh tay vào OpenAI và cung cấp dịch vụ đám mây Azure cho A社, sở hữu nguồn tài nguyên điện toán đám mây mà mọi doanh nghiệp đều ngưỡng mộ, nhưng chi phí token vẫn khiến họ đau đầu. Không chỉ riêng Microsoft, CTO của Uber đã báo cáo với ban lãnh đạo vào tháng 4 năm nay một tình huống đáng ngại: ngân sách AI dành cho cả năm 2026 đã bị tiêu hết chỉ sau bốn tháng, trong đó 95% kỹ sư sử dụng công cụ lập trình AI hàng tháng và 70% mã được tạo bởi AI, lời nói nguyên văn là: “I’m back to the drawing board because the budget I thought I would need is blown away already.”

Ngân sách Token của các công ty lớn bị tiêu hao nhanh hơn nhiều so với dự kiến, dù có nguyên nhân từ nhân viên công ty “coi đậu bao như không phải lương thực” và tiêu xài vô tội vạ Token, nhưng nguyên nhân cốt lõi khiến ngân sách Token trở nên căng thẳng là AI đang trở nên đắt đỏ hơn. Giá phần mềm AI tại Mỹ đã tăng từ 20% đến 37% trong năm qua. Ba ông lớn Anthropic, OpenAI và Google đều đã âm thầm tăng giá thực tế cho cùng một đầu ra AI trong sáu tháng qua.

Liang Wenfeng

(Nguồn hình ảnh: X)

Trước đây, âm thanh phổ biến là “AI càng được ứng dụng quy mô lớn, mức độ công nghiệp hóa càng cao, chi phí càng thấp, doanh nghiệp càng vui”, nhưng hóa ra lại quá ngây thơ.

Và xu hướng này sẽ không đảo ngược. Giá cả được xác định bởi cung cầu, chứ không phải chi phí, nhưng mối quan hệ cung cầu của AI đã hoàn toàn đảo ngược vào năm 26. Trước đây, các công ty lớn phải năn nỉ mọi người sử dụng AI, phải giáo dục thị trường và quảng bá công nghệ, AI luôn được trợ cấp—bạn đã uống bao nhiêu ly trà sữa Qwen rồi? Giờ thì sao? Mọi người ngày càng chủ động sử dụng, “hít một ngụm là không thể bỏ được”—AI lập trình, AI tài liệu, AIGC và thậm chí AI tìm kiếm đều ngày càng phổ biến, thời kỳ trợ cấp AI đã chính thức kết thúc.

Người dùng càng nhiều, nhu cầu càng lớn, nguồn tài nguyên token càng trở nên khan hiếm, do đó tình trạng thiếu hụt năng lực tính toán đã lan từ GPU sang CPU, bộ nhớ và thậm chí là băng thông. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk cùng các công ty trong nước như江波龙 (Jiangbo Long) và các công ty khác đang cùng NVIDIA cùng hưởng lợi. Doanh thu tăng gấp nhiều lần của các ông lớn bán dẫn vào năm 2026 đến từ đâu? Rõ ràng không phải từ vòng đầu tư tam giác OpenAI-Oracle-Microsoft đâu nhé? Sự đau đầu của các doanh nghiệp mới chỉ là khởi đầu. Đồng thời, các sản phẩm AI như ChatGPT, Claude, Gemini, DouBao nhấn mạnh sự phân cấp rõ rệt giữa phiên bản miễn phí và trả phí, khiến người dùng cá nhân ngày càng cảm thấy bối rối.

Giống như dịch vụ xe công nghệ: những lúc cao điểm, bạn có thể đi xe cao cấp miễn phí để đi làm và về nhà, vốn đầu tư chi trả thay bạn. Sau khi người dùng hình thành thói quen, trợ cấp kết thúc, giá cả trở về mức bình thường, ai phải đi xe buýt thì vẫn phải đi xe buýt. AI cũng vậy. Vì vậy, trong bối cảnh tất cả các token ngành lớn đều tăng giá, DeepSeek vẫn kiên trì giảm giá xuống thấp hơn nữa — hành động này không còn đơn thuần là sự dũng cảm cá nhân của “Bồ Tát ảo”, mà còn thể hiện một quyền lực định giá ngược: tôi có thể rẻ đến thế, vẫn vận hành bình thường và chất lượng không hề giảm sút.

Chỉ cần Liang Wenheng muốn, DeepSeek hoàn toàn không cần phải rẻ mạt đến mức này. Vì vậy, mọi người bắt đầu lo lắng: Liệu DeepSeek có trở thành Linux của thời đại AI không—ảnh hưởng khổng lồ nhưng khó kiếm được nhiều tiền? Linux đóng góp lớn hơn nhiều cho ngành công nghiệp CNTT so với Windows hay Android (Android bản thân nó dựa trên nhân Linux), nhưng nó là mã nguồn mở và chưa tạo ra được những đế chế thương mại như Microsoft hay Google. Hiện tại, DeepSeek có ảnh hưởng rất lớn, nhưng năng lực thương mại còn xa mới bằng ba ông lớn ở Thung lũng Silicon, thậm chí còn không thể sánh ngang với ba công ty trong nước là Kimi, MiniMax và Zhipu. Thứ tự doanh thu của bốn công ty hàng đầu năm 2025: Zhipu (doanh thu 724 triệu nhân dân tệ năm 2025) > MiniMax (doanh thu khoảng 560 triệu nhân dân tệ năm 2025) > Mặt Tối Của Mặt Trăng (khoảng 200 triệu nhân dân tệ) > DeepSeek (chưa rõ nhưng thấp hơn).

Liang Wenheng kiếm tiền thông qua định lượng AI, cá nhân ông có thể đầu tư 20 tỷ nhân dân tệ vào DeepSeek, nhưng câu chuyện “dùng tình yêu để phát điện” không thể kéo dài.

Trong chế độ mã nguồn mở, người khác cũng có thể tiến hành chưng cất, triển khai và huấn luyện lại, khiến hàng rào công nghệ của DeepSeek ngày càng mỏng đi. Vì vậy, bạn luôn bắt gặp những tin tức “đánh bật bảng xếp hạng” như thế này: sau khi Zhipu GLM-5.1 mở mã nguồn, nó đã phá vỡ thành tích toàn cầu trên bài kiểm tra SWE-bench Pro; MiMo-V2.5-Pro của Xiaomi vươn lên dẫn đầu danh sách các mô hình lớn mã nguồn mở toàn cầu... Báo cáo chung của MIT và Hugging Face cho thấy, trong năm qua, tỷ lệ tải xuống các mô hình mã nguồn mở do Trung Quốc phát triển chiếm 17,1% toàn cầu, vượt qua 15,8% của Mỹ và đứng đầu thế giới.

Không ngạc nhiên khi ngày càng nhiều tiếng nói ở Thung lũng Silicon nói rằng: nhất định phải có một phiên bản DeepSeek của Mỹ, không thể ngồi nhìn ngành AI lại tái hiện câu chuyện của Shein, Temu hoặc TikTok. “Nếu Mỹ không có một nhà vô địch mã nguồn mở nổi lên, thế giới sẽ nằm trong tay bất kỳ quốc gia nào có thể sản xuất ra các mô hình và phần mềm mã nguồn mở mạnh nhất, ổn định nhất, rẻ nhất, có thể tùy chỉnh, mở rộng và phù hợp với nhu cầu cá nhân lẫn doanh nghiệp.” Những chủ đề liên quan đến cạnh tranh giữa các cường quốc thường nghe có vẻ lớn lao, nhưng cuộc cạnh tranh đằng sau lại vô cùng thực tế.

Sự trỗi dậy của DeepSeek vốn đã mang theo câu chuyện tự thay thế. Việc V4 hỗ trợ Ascend khiến mọi người vô cùng phấn khởi; dưới sự thúc đẩy của năng lực tính toán trong nước, khả năng cạnh tranh về giá mà DeepSeek đang thể hiện hiện nay mới chỉ là món khai vị. Trong báo cáo kỹ thuật, DeepSeek cho biết sau khi các siêu nút Ascend 950 được đưa ra thị trường hàng loạt vào nửa cuối năm, giá của V4-Pro sẽ còn giảm mạnh hơn nữa — những ngày tốt đẹp hơn vẫn đang ở phía trước.

Còn có lợi thế về nhân tài AI cấp cao, nhân tài AI đều đắt đến mức “cao cấp vượt mức cần thiết”, nhưng ở Trung Quốc lại tương đối rẻ hơn; lương 10 triệu nhân dân tệ của Lei Jun để thu hút Luo Fuli từ DeepSeek đã trở thành tin tức, trong khi cùng thời điểm đó, Zuckerberg phải chi 1 tỷ USD để tuyển người, bao gồm cả hình thức Acqui-hire. Nhưng sản phẩm do những người được trả 1 tỷ USD và những người được trả lương 10 triệu USD tạo ra rõ ràng không có sự chênh lệch lớn đến 700 lần; sự chênh lệch giá cả của nhân tài AI thực chất sẽ chuyển hóa thành sự chênh lệch hệ thống trong hệ thống sản xuất Token.

Sức cạnh tranh lớn hơn còn nằm ở hệ thống năng lượng, đây là tầng đầu tiên trong bánh kem năm tầng của Huang Renxun về AI.

Chân lý cuối cùng của AI là năng lực tính toán, và chân lý cuối cùng của năng lực tính toán là điện năng. Tháng 4 năm 2026, DeepSeek tuyển dụng kỹ sư vận hành cấp cao và quản lý giao hàng cấp cao tại trung tâm dữ liệu ở Wulanchabu, Nội Mông, điều này cho thấy họ đang xây dựng nhà máy Token ở phía tây, đẩy lợi thế chi phí từ tầng phần mềm xuống tầng vật lý. Lần trước, tôi đã viết trong bài báo rằng Wulanchabu được chọn khi Kuaishou xây dựng trung tâm dữ liệu tại đây: gần nhà máy điện và khí hậu thuận lợi để tản nhiệt. Hơn nữa, giá điện xanh ở phía tây Trung Quốc khoảng 0,2-0,3 nhân dân tệ/kWh, chỉ bằng 1/5 đến 1/4 so với châu Âu và Mỹ.

Không chỉ điện xanh ở miền Tây có tính cạnh tranh. Theo dữ liệu của Cơ quan Năng lượng Quốc tế năm 2025, tổng công suất lắp đặt phát điện của Trung Quốc đã vượt quá 2.300 GW, chiếm khoảng 22% toàn cầu, đứng đầu thế giới; trong khi Mỹ khoảng 1.300 GW. Quan trọng hơn, Trung Quốc sở hữu cấu trúc điện lực hoàn chỉnh nhất thế giới: nhiệt điện, thủy điện, điện gió, điện hạt nhân và điện mặt trời đều đầy đủ. Dữ liệu cho thấy, giá điện công nghiệp của Trung Quốc duy trì ổn định ở mức 0,06 đến 0,08 USD/kWh, trong khi giá điện công nghiệp ở California, Mỹ đã gần đạt 0,18 USD/kWh, một số khu vực ở Đức thậm chí vượt quá 0,25 USD/kWh, điều này có nghĩa là cùng một quá trình huấn luyện một cụm 10.000 card, Trung Quốc tự nhiên rẻ hơn châu Âu và Mỹ hàng chục phần trăm.

Trong chi phí vận hành của các mô hình AI quy mô lớn, chi phí điện chiếm tỷ lệ lên tới 60%-70% tổng chi phí vận hành, không chỉ vì mô hình chạy cần điện, mà còn do chi phí làm mát cực lớn. Ngay cả “kẻ cuồng xây dựng hạ tầng” cũng đã xây trung tâm dữ liệu ngay dưới đáy biển, vừa tận dụng điện gió biển gần đó, vừa dùng nước biển tuần hoàn để làm mát miễn phí. Ngoài ra, còn có những dự án quy mô lớn như “Chuyển điện từ Đông sang Tây” và “Chuyển dữ liệu từ Đông sang Tây”, với khả năng điều phối điện năng và năng lực tính toán giữa các khu vực cực kỳ mạnh mẽ. Các khu vực như Quý Châu, Nội Mông và Ninh Hạ vốn đã là các nút then chốt của “Chuyển dữ liệu từ Đông sang Tây”, và con đường di chuyển trung tâm AI tính toán về phía Tây đã được chuẩn bị sẵn sàng.

Sử dụng AI của Trung Quốc, về bản chất là sử dụng AI được huấn luyện bởi hệ thống năng lượng cạnh tranh hơn—AI kinh tế và phổ cập hơn. Đây là một trong những lý do doanh thu nước ngoài của Kimi, Minimax và các công ty khác tăng vọt sau Tết Nguyên Đán, không chỉ vì thuật toán mạnh hơn, mà còn vì họ đã sử dụng “mẹo” giá điện.

NVIDIA có thể định nghĩa giá cho sức mạnh tính toán cao cấp, nhưng những công ty như DeepSeek lại đang nắm quyền định giá Token. Bạn có thể nói rằng, AI rẻ thì không tốt. Thực tế, AI đúng là “tiền nào của nấy”, DeepSeek V4 chỉ thu hẹp khoảng cách giữa mô hình mã nguồn mở và mã nguồn đóng xuống mức nhỏ nhất trong lịch sử, chính thức thừa nhận khoảng cách khách quan so với các mô hình hàng đầu như GPT, và hơn nữa, nó chưa phải là mô hình đa phương tiện — có thể nhận diện hình ảnh nhưng không thể tạo ra chúng.

Nhưng điều này không ngăn được cộng đồng đổ xô đến DeepSeek. Lý do là: phần lớn các tình huống kinh doanh thực tế không cần phải gọi mô hình mạnh nhất thế giới mỗi lần. Tư vấn, dịch vụ khách hàng, tóm tắt, dịch thuật, hoàn thành mã, kho tri thức doanh nghiệp, quy trình tự động hóa — những thứ này không đòi hỏi trí tuệ cao nhất, mà là “dùng được + đủ rẻ + đủ ổn định”. Khi chi phí suy luận của DeepSeek V4 chỉ bằng khoảng 1% (Flash) đến 11% (Pro) so với GPT-5.5, một doanh nghiệp có thể gọi nhiều chục lần token với cùng ngân sách, thử nghiệm nhiều chuỗi prompt hơn, lặp lại nhiều luồng công việc agent hơn, và cuối cùng kết quả đầu ra thậm chí còn có khả năng tốt hơn, bởi AI bản thân là một “trò chơi xác suất” — chỉ cần đủ rẻ, dùng tạm được để có kết quả thì có gì phải ngại?

Vì vậy, AI càng đắt, giá trị của DeepSeek càng trở nên nổi bật, công ty DeepSeek càng có giá trị, và Liang Wenhfeng cùng các nhà đầu tư của ông hiểu rõ điều này hơn bất kỳ ai khác.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.