Kiến trúc ZCube Network giúp giảm chi phí và cải thiện hiệu suất trong suy luận mô hình lớn

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Nâng cấp mạng ZCube giải quyết các vấn đề tách PD trong suy luận mô hình lớn, theo tin tức trên chuỗi. Được phát triển bởi ZhiPu, YuXun Network và Đại học Thanh Hoa, kiến trúc hiện đã được triển khai trong GLM-5.1. Nó giảm chi phí công tắc và mô-đun quang 33%, tăng thông lượng GPU 15% và giảm độ trễ P99 cho token đầu tiên 40,6%.

Tin tức từ AIMPACT, ngày 21 tháng 5 (UTC+8), theo giám sát của Beating, nhằm giải quyết vấn đề tắc nghẽn mạng có tính cấu trúc ngày càng nghiêm trọng trong việc triển khai tách rời PD (Prefill-Decode) cho các mô hình lớn, Zhipu, Yuxun Network và Đại học Thanh Hoa đã hợp tác nghiên cứu, đề xuất và triển khai kiến trúc mạng ZCube trong môi trường sản xuất trực tuyến GLM-5.1 với hàng nghìn GPU. Khi推理 dài và tách rời PD trở thành tiêu chuẩn, việc truyền tải KV Cache giữa các nút khiến lưu lượng推理 thể hiện đặc điểm bất đối xứng nghiêm trọng, khiến kiến trúc ROFT (Rail-Optimized Fat-Tree) truyền thống dễ gây ra điểm nóng cục bộ và xung đột đường truyền. ZCube loại bỏ tầng Spine switch, áp dụng kiến trúc mạng phẳng hoàn toàn (đường kính mạng 2 nhảy), kết hợp cơ chế kết nối hỗn hợp đơn轨/đa轨, đạt được cân bằng tải lưu lượng giữa toàn bộ switch trong mạng giữa các nút ở cấp độ kiến trúc. Trong các bài kiểm tra hiệu năng trên cụm sản xuất thực tế, với điều kiện giữ nguyên GPU, stack phần mềm và ứng dụng, kiến trúc ZCube giảm 33% chi phí phần cứng cho switch và module quang so với kiến trúc truyền thống, đồng thời tăng 15% tốc độ xử lý trung bình của GPU và giảm 40,6% độ trễ P99 của Token đầu tiên (TTFT). (Nguồn: BlockBeats)

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.