Đại học Thanh Hoa và Mianbi mở nguồn khung tiền huấn luyện AI-lập trình đầu tiên trên thế giới ForgeTrain

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Đại học Thanh Hoa và Mianbi đã mở nguồn ForgeTrain, khung đào tạo tiền xử lý đầu tiên trên thế giới được viết bởi AI dành cho tin tức AI + tiền điện tử. Khung này vượt trội hơn Megatron của NVIDIA và tăng tốc độ lên 10% trên Huawei Ascend. Nó cũng tạo ra MiniCPM5-1B, một mô hình nhỏ xếp hạng hàng đầu. Dự án này làm nổi bật tiềm năng tích hợp tin tức về tài sản thực tế (RWA) khi các công cụ AI tiếp tục phát triển.
ME AI tin tức, theo giám sát của Beating, FaceWall AI và Phòng thí nghiệm NLP của Đại học Thanh Hoa đã cùng hợp tác mở nguồn trên cộng đồng OpenBMB framework tiền huấn luyện ForgeTrain lớn đầu tiên trên thế giới được viết hoàn toàn bởi AI, đồng thời công bố mô hình nhỏ đầu cuối được huấn luyện bởi ForgeTrain — MiniCPM5-1B. Là mẫu đầu tiên thể hiện chu trình kỹ thuật “AI tạo ra AI”, ForgeTrain đã vượt trội về hiệu năng so với Megatron của NVIDIA trong điều kiện phần cứng tương đương và đạt tốc độ tăng 10% khi tiền huấn luyện trên Ascend của Huawei. Đồng thời, MiniCPM5-1B đã đứng đầu bảng xếp hạng các mô hình nhỏ có trọng số mở của Artificial Analysis. Để cho phép AI tự xây dựng hạ tầng tiền huấn luyện cơ sở, FaceWall AI đã đề xuất mô hình lập trình phần mềm “Forge Engineering”, từ bỏ các framework tổng quát tương thích với mọi phần cứng và nhiệm vụ, thay vào đó tận dụng khả năng tạo mã chi phí thấp của AI để chế tạo mã chuyên dụng cho từng mô hình và phần cứng cụ thể. Về cơ chế xây dựng, ForgeTrain áp dụng phương pháp ba giai đoạn: trước tiên thu thập dữ liệu quan trọng từ các framework tiền huấn luyện hiện có để tạo ra “hội đồng thi” (Harness), sau đó lặp lại tự động để sinh mã framework đồng nhất về nhị phân, cuối cùng gỡ bỏ giới hạn và vượt qua phiên bản tham chiếu. Toàn bộ quá trình tự động hóa này tương ứng với giai đoạn L3 đến L4 của “AI tạo ra AI”. Là mô hình đầu tiên được tạo ra bởi ForgeTrain, MiniCPM5-1B có 1,08 tỷ tham số, kiến trúc cốt lõi dựa trên LlamaForCausalLM chuẩn, giúp giảm đáng kể rào cản tích hợp và triển khai suy luận ở tầng dưới. Trong đánh giá của Artificial Analysis, mô hình đạt 18 điểm, vượt Qwen3.5-2B quy mô 2B (16 điểm), dẫn trước Qwen3.5-0.8B (11 điểm) và LFM2.5-1.2B-Thinking (8 điểm). Mô hình hỗ trợ các định dạng triển khai như MLX 4-bit và GGUF Q4_K_M; sau khi lượng tử hóa INT4, trọng số chỉ còn 0,5GB và hỗ trợ bản địa ngữ cảnh văn bản dài lên đến 131.072 token cùng suy luận lai hai chế độ dựa trên enable_thinking. Nhờ chi phí phần cứng cực thấp, OpenBMB đồng thời đã mở nguồn ứng dụng trợ lý desktop chạy hoàn toàn ngoại tuyến — MiniCPM Desk Pet, hỗ trợ phản hồi thời gian thực với các hoạt động mã hóa trong các công cụ phát triển như Cursor và chuyển đổi nhân vật LoRA. (Nguồn: BlockBeats)
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.