Caltech phát hành mã nguồn mô hình Bonsai 1-bit: 8 tỷ tham số, dung lượng 1,15 GB, tốc độ 44 token/giây trên iPhone

iconChainthink
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Tin tức trên chuỗi: PrismML của Caltech, do Babak Hassibi dẫn đầu, đã mở nguồn các mô hình AI Bonsai 1-bit. Phiên bản 8B có 8,2 tỷ tham số, dung lượng bộ nhớ 1,15 GB và chạy với tốc độ 44 token mỗi giây trên iPhone 17 Pro Max. Tin tức AI + tiền mã hóa: Mô hình này sử dụng ít năng lượng hơn 4-5 lần so với các phiên bản 16-bit. PrismML đã huy động được 16,25 triệu USD trong các vòng SAFE và seed từ Khosla Ventures, Cerberus Capital và Caltech.

Theo thông báo từ ChainThink, vào ngày 1 tháng 4 năm 2026, theo giám sát của 1M AI News, phòng thí nghiệm AI PrismML do nhà toán học tại Viện Công nghệ California Babak Hassibi đồng sáng lập đã kết thúc giai đoạn ẩn danh và mở nguồn các mô hình ngôn ngữ lớn chuỗi 1-bit Bonsai. Mô hình chủ lực 1-bit Bonsai 8B có 8,2 tỷ tham số, chiếm dụng bộ nhớ chỉ 1,15 GB, giảm kích thước khoảng 14 lần so với các mô hình 16-bit cùng cấp độ, đồng thời cũng công bố hai mô hình nhỏ hơn là 4B (0,5 GB) và 1,7B (0,24 GB).


Bonsai 8B là mô hình 1-bit chân thực end-to-end, với các lớp nhúng, lớp chú ý, lớp MLP và đầu ra đầu ra đều chỉ sử dụng trọng số +1 hoặc -1, không có patch độ chính xác cao. PrismML cho biết khả năng suy luận và hiểu ngôn ngữ của mô hình này trên các bài kiểm tra chuẩn tương đương với các mô hình độ chính xác đầy đủ 16-bit, toán học nén cốt lõi do nhóm nghiên cứu phát triển trong nhiều năm tại Caltech, quyền sở hữu trí tuệ thuộc về Caltech, PrismML là bên được cấp phép độc quyền duy nhất, mô hình được huấn luyện trên TPU v4 của Google.


Về tốc độ thực tế, M4 Pro Mac đạt 136 tok/s, RTX 4090 đạt 440 tok/s, iPhone 17 Pro Max đạt khoảng 44 tok/s; mô hình chuẩn 16-bit 8B không thể nạp vào bất kỳ iPhone nào, mức tiêu thụ năng lượng giảm khoảng 4-5 lần so với mô hình 16-bit. PrismML chỉ ra rằng phần cứng hiện tại không được thiết kế cho suy luận 1-bit, lợi thế về tốc độ và tiêu thụ năng lượng chủ yếu đến từ việc giảm dung lượng bộ nhớ; nếu trong tương lai xuất hiện phần cứng được thiết kế đặc biệt cho 1-bit, hiệu suất còn có thể tăng thêm một cấp độ.


PrismML đã huy động được 16,25 triệu USD trong vòng tài trợ SAFE và vòng seed từ các nhà đầu tư Khosla Ventures, Cerberus Capital và Caltech. Chủ tịch Khosla Ventures, Vinod Khosla, đánh giá thành tựu này là “không phải một bản cập nhật nhỏ, mà là một bước đột phá công nghệ lớn, một bước tiến về toán học, không chỉ là một mô hình nhỏ nữa”.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.