PANews ngày 21 tháng 3 thông báo, theo thông báo chính thức, Tether đã ra mắt khung tinh chỉnh LoRA chéo nền tảng trong QVAC Fabric, nhằm tối ưu hóa việc huấn luyện và suy luận cho Microsoft BitNet (1-bit LLM). Khung này làm giảm đáng kể nhu cầu về sức mạnh tính toán và bộ nhớ, cho phép các mô hình có hàng tỷ tham số được huấn luyện và tinh chỉnh trên laptop, GPU tiêu dùng và điện thoại thông minh. Đây là giải pháp đầu tiên cho phép tinh chỉnh mô hình BitNet trên GPU di động (bao gồm Adreno, Mali và Apple Bionic). Kết quả kiểm nghiệm cho thấy mô hình 125M tham số có thể được tinh chỉnh trong khoảng 10 phút, mô hình 1B trong khoảng 1 giờ, và thậm chí có thể mở rộng lên mô hình 13B tham số trên điện thoại. Ngoài ra, khung này hỗ trợ các phần cứng dị cấu trúc như Intel, AMD và Apple Silicon, đồng thời là lần đầu tiên thực hiện tinh chỉnh LoRA cho 1-bit LLM trên thiết bị không phải NVIDIA. Về hiệu năng, tốc độ suy luận của mô hình BitNet trên GPU di động nhanh hơn từ 2 đến 11 lần so với CPU, đồng thời giảm tối đa khoảng 77,8% dung lượng bộ nhớ đồ họa so với các mô hình 16-bit truyền thống. Tether cho biết công nghệ này có tiềm năng phá vỡ sự phụ thuộc vào sức mạnh tính toán cao cấp và cơ sở hạ tầng đám mây, thúc đẩy xu hướng huấn luyện AI hướng tới phi tập trung và cục bộ, đồng thời cung cấp nền tảng cho các ứng dụng mới như học liên kết.
Tether ra mắt khung BitNet LoRA đa nền tảng để đào tạo mô hình hàng tỷ tham số trên các thiết bị người dùng tiêu dùng
PANewsChia sẻ






Tether đã giới thiệu khung BitNet LoRA đa nền tảng dành cho tin tức trên chuỗi và tin tức tiền điện tử, cho phép huấn luyện các mô hình 1-bit BitNet của Microsoft trên phần cứng người dùng tiêu dùng. Công cụ này cho phép các mô hình hàng tỷ tham số chạy trên laptop, điện thoại thông minh và GPU như Adreno, Mali và Apple Bionic. Một mô hình 1 tỷ tham số mất khoảng một giờ để tinh chỉnh. Hệ thống hỗ trợ Intel, AMD và Apple Silicon, mang việc tinh chỉnh LoRA 1-bit cho các mô hình ngôn ngữ lớn đến các thiết bị không phải NVIDIA lần đầu tiên. Các mô hình BitNet chạy nhanh hơn 2–11 lần trên GPU di động so với CPU, sử dụng ít hơn 77,8% bộ nhớ so với phiên bản 16-bit. Tether tuyên bố công nghệ này có thể giảm sự phụ thuộc vào đám mây, cho phép huấn luyện AI phi tập trung.
Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.