มหาวิทยาลัยชิงฮวาและเมียนบิเปิดตัวกรอบการฝึกล่วงหน้าสำหรับการเขียนโค้ดด้วยปัญญาประดิษฐ์ ForgeTrain ซึ่งเป็นกรอบแรกของโลก
KuCoinFlashมหาวิทยาลัยชิงหัวและ Mianbi เปิดตัว ForgeTrain ซึ่งเป็นกรอบงานการฝึกอบรมล่วงหน้าที่เขียนโดย AI แห่งแรกของโลกสำหรับข่าว AI + คริปโต กรอบงานนี้มีประสิทธิภาพดีกว่า Megatron ของ NVIDIA และเพิ่มความเร็วขึ้น 10% บน Huawei Ascend นอกจากนี้ยังสร้าง MiniCPM5-1B ซึ่งเป็นโมเดลขนาดเล็กที่จัดอันดับสูงสุด โครงการนี้เน้นศักยภาพของการรวมข่าวเกี่ยวกับสินทรัพย์จริง (RWA) เมื่อเครื่องมือ AI พัฒนาขึ้น
ME AI ข่าว ตามการตรวจสอบของ Beating บริษัท FaceWall AI ร่วมกับห้องปฏิบัติการ NLP ของมหาวิทยาลัยชิงฮัวได้เปิดตัว ForgeTrain ซึ่งเป็นกรอบการฝึกอบรมแบบพรีเทรนด์ระดับผลิตภัณฑ์ขนาดใหญ่ที่ถูกเขียนขึ้นโดย AI อย่างสมบูรณ์แบบเป็นครั้งแรกของโลกภายใต้ชุมชน OpenBMB และเผยแพร่โมเดลขนาดเล็กสำหรับอุปกรณ์ปลายทาง MiniCPM5-1B ที่ถูกฝึกด้วย ForgeTrain 作为首个展示「AI 制造 AI」工程闭环的样本,ForgeTrain ในสภาวะฮาร์ดแวร์เดียวกันมีประสิทธิภาพเหนือ Megatron ของ NVIDIA และยังสามารถเร่งความเร็วได้ 10% เมื่อใช้ Huawei Ascend ในการฝึกอบรมพรีเทรนด์ ในขณะเดียวกัน MiniCPM5-1B ได้รับตำแหน่งอันดับหนึ่งในรายการโมเดลขนาดเล็กแบบเปิดน้ำหนักของ Artificial Analysis เพื่อให้ AI สามารถสร้างโครงสร้างพื้นฐานการฝึกอบรมขั้นพื้นฐานด้วยตนเอง FaceWall AI ได้เสนอรูปแบบการเขียนโปรแกรมซอฟต์แวร์ใหม่ที่เรียกว่า “Forge Engineering” โดยเลิกใช้กรอบงานทั่วไปที่รองรับฮาร์ดแวร์และงานทุกประเภท และหันมาใช้ความสามารถในการสร้างโค้ดต้นทุนต่ำของ AI เพื่อผลิตโค้ดเฉพาะสำหรับโมเดลและฮาร์ดแวร์เฉพาะเจาะจง ในเชิงกลไก การพัฒนา ForgeTrain ใช้วิธีสามขั้นตอน: ก่อนอื่นรวบรวมข้อมูลสำคัญจากกรอบการฝึกอบรมที่มีอยู่เพื่อสร้าง “Harness” จากนั้นวนซ้ำในระบบปิดอัตโนมัติเพื่อสร้างโค้ดกรอบงานที่สอดคล้องกันในระดับไบนารี และสุดท้ายปลดข้อจำกัดเพื่อให้สามารถเกินกว่าการดำเนินการอ้างอิง การพัฒนาอัตโนมัตินี้สอดคล้องกับขั้นตอน L3 ถึง L4 ของการ “AI สร้าง AI” เป็นโมเดลแรกที่ผลิตจาก ForgeTrain MiniCPM5-1B มีพารามิเตอร์ 1.08 พันล้าน โดยโครงสร้างหลักอิงตาม LlamaForCausalLM มาตรฐาน ซึ่งลดข้อจำกัดในการรวมและปรับใช้การอนุมานในระดับล่างอย่างมาก ในการประเมินของ Artificial Analysis โมเดลนี้ได้คะแนน 18 ซึ่งสูงกว่า Qwen3.5-2B ขนาด 2B (16 คะแนน) และนำหน้า Qwen3.5-0.8B (11 คะแนน) และ LFM2.5-1.2B-Thinking (8 คะแนน) โมเดลนี้รองรับรูปแบบการปรับใช้เช่น MLX 4-bit และ GGUF Q4_K_M เมื่อใช้การควอนไทซ์ INT4 น้ำหนักจะลดเหลือเพียง 0.5GB และรองรับเนื้อหาข้อความยาวถึง 131,072 tokens โดยธรรมชาติพร้อมการอนุมานแบบผสมสองโหมดที่ใช้ enable_thinking โดยอาศัยค่าใช้จ่ายฮาร์ดแวร์ต่ำมาก OpenBMB ยังได้เปิดตัวแอปพลิเคชันเดสก์ท็อปแบบออฟไลน์บริสุทธิ์ชื่อ MiniCPM Desk Pet ซึ่งรองรับการตอบสนองแบบเรียลไทม์ต่อกิจกรรมการเขียนโค้ดในเครื่องมือพัฒนาเช่น Cursor และการสลับโปรไฟล์ผู้ใช้ผ่าน LoRA (ที่มา: BlockBeats)คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้
การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา