Dấu mốc AI Trung Quốc: Mô hình DeepSeek 1,6 nghìn tỷ tham số đã được huấn luyện hoàn toàn trên Ascend 910C trong nước

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Một đội ngũ liên hợp bao gồm Trường Cao đẳng Hetao Thâm Quyến, HIT (Thâm Quyến), Viện Nghiên cứu Dữ liệu Lớn Thâm Quyến và Huawei đã hoàn thành quá trình huấn luyện sau sau toàn bộ mô hình DeepSeek-V4-Pro với 1,6 nghìn tỷ tham số trên nền tảng AI Ascend 910C trong nước. Tin tức trên chuỗi này đánh dấu lần đầu tiên một nhóm bên thứ ba đạt được việc huấn luyện toàn bộ mô hình 1,6T tham số bằng hơn 1.000 chip Ascend 910C. Đội ngũ đã cải thiện mức sử dụng tính toán của mô hình hơn 30% và hiệu quả của các bộ xử lý chính lên 14%, với không có sự cố hệ thống nào trong hơn 1.500 bước huấn luyện. Tin tức AI + tiền điện tử nhấn mạnh năng lực và hạ tầng AI trong nước đang ngày càng phát triển.
ME AI tin tức, theo giám sát của Beating, một đội ngũ hợp tác gồm Học viện Thâm Quyến Hà Phù, Đại học Khoa học và Công nghệ Hoa Trung (Thâm Quyến), Viện Nghiên cứu Dữ liệu Lớn Thâm Quyến và các nhóm liên quan của Huawei, đã công bố thành công trong việc thực hiện toàn bộ quá trình hậu huấn luyện (Post-training) cho mô hình lớn 1,6 nghìn tỷ tham số DeepSeek-V4-Pro trên nền tảng AI nội địa. Đây là lần đầu tiên một tổ chức bên thứ ba trên toàn cầu hoàn thành hậu huấn luyện toàn bộ tham số cho mô hình quy mô 1,6 nghìn tỷ tham số trên nền tảng tính toán nội địa. So với tiền huấn luyện (Pre-training) từ đầu, giai đoạn hậu huấn luyện (chủ yếu bao gồm tinh chỉnh có giám sát SFT và học tăng cường RL) tập trung vào việc hướng dẫn mô hình tuân theo lệnh và thực hiện các nhiệm vụ cụ thể thông qua các hướng dẫn chất lượng cao và căn chỉnh sở thích con người. Tuy nhiên, đối với mô hình MoE có 1,6 nghìn tỷ tham số, hậu huấn luyện toàn bộ tham số vẫn đòi hỏi rất khắt khe về dung lượng bộ nhớ GPU của phần cứng cơ sở, băng thông truyền thông giữa nhiều card (như truyền thông toàn bộ-đến-toàn bộ do định tuyến MoE kích hoạt) và độ ổn định của cụm quy mô lớn. Đội ngũ hợp tác đã dựa vào cụm tính toán Huawei Ascend 910C với quy mô hơn một nghìn chip, thông qua tối ưu hóa chiến lược phân phối tải và cân bằng tải, đã thành công vượt qua các điểm nghẽn truyền thông. Trong suốt hơn 1.500 bước huấn luyện, hệ thống không xảy ra bất kỳ sự gián đoạn nào, hiệu suất sử dụng tính toán mô hình (MFU) vượt quá 30%, hiệu quả của các toán tử then chốt được cải thiện 14%, tất cả các chỉ số đều đạt tiêu chuẩn vận hành công nghiệp. Các chuyên gia trong ngành nhận định rằng việc Huawei Ascend 910C thành công trong việc chạy mô hình quy mô nghìn tỷ tham số xác nhận tính khả thi kỹ thuật của chip AI nội địa trong việc thực hiện các nhiệm vụ huấn luyện sâu cho mô hình quy mô cực lớn. Trước đây, việc huấn luyện tiền cơ bản cho các mô hình lớn chủ yếu phụ thuộc vào cụm GPU NVIDIA, trong khi tính toán nội địa chủ yếu chỉ đảm nhận các nhiệm vụ suy luận (Inference) hoặc tinh chỉnh với tham số nhỏ. Thành công của cuộc hợp tác này đánh dấu sự chuyển đổi nhanh chóng của hệ sinh thái tính toán nội địa từ “chỉ hỗ trợ suy luận” sang “đảm nhận huấn luyện toàn bộ tham số cho mô hình quy mô cực lớn”. (Nguồn: MLion)
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.