Tsinghua Üniversitesi ve Mianbi, dünyanın ilk AI-kodlama ön-eğitim çerçevesi ForgeTrain'i açık kaynak hale getiriyor

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
Tsinghua Üniversitesi ve Mianbi, AI + kripto haberleri için dünyada ilk AI tarafından yazılan ön-eğitim çerçevesi olan ForgeTrain'i açık kaynak yaptı. Bu çerçeve, NVIDIA'nın Megatron'u aşarak Huawei Ascend üzerinde hızı %10 artırıyor. Ayrıca, üst sıralarda yer alan MiniCPM5-1B adlı kompakt bir model üretti. Proje, AI araçları ilerledikçe gerçek dünya varlıkları (RWA) haberlerinin entegrasyonu için potansiyeli vurguluyor.
ME AI Haberi, Beating İzleme’ye göre, FaceWall AI ve Tsinghua Üniversitesi NLP Laboratuvarı, OpenBMB topluluğunda dünyada ilk kez tamamen AI tarafından yazılan üretim seviyesinde büyük model ön-eğitim çerçevesi ForgeTrain’i açık kaynaklı hale getirdi ve ForgeTrain ile eğitilen uç model MiniCPM5-1B’i duyurdu. «AI, AI’yı üretiyor» işlemsel döngüsünü ilk kez gösteren örnek olan ForgeTrain, aynı donanım koşullarında NVIDIA’nın Megatron’undan daha iyi performans gösterdi ve Huawei Ascend üzerinde ön-eğitim sırasında %10 hızlanma sağladı. Aynı zamanda MiniCPM5-1B, Artificial Analysis açık ağırlıklı küçük model listesinde birinci oldu. AI’nın alt yapı ön-eğitim altyapısını kendi kendine oluşturabilmesi için FaceWall AI, «üretim mühendisliği» (Forge Engineering) adlı bir yazılım programlama paradigmasi önerdi ve tüm donanımlarla ve görevlerle uyumlu genel çerçeveleri bırakarak, AI’nın düşük maliyetli kod üretme yeteneğini kullanarak belirli modeller ve donanımlar için özel kodlar üretti. Yapı mekanizması olarak, ForgeTrain üç aşamalı bir yöntem izliyor: İlk olarak mevcut ön-eğitim çerçevelerinden kritik veriler toplanarak bir test sahası (Harness) oluşturuluyor, ardından otomatik döngü içinde ikili olarak tutarlı çerçeve kodları üretiliyor ve nihayetinde kısıtlamalar kaldırılarak referans uygulamayı aşılıyor. Tüm otomatik gelişim, AI’nın AI’yı üretmesinin L3 ile L4 aşamalarına karşılık geliyor. ForgeTrain’in ilk ürüni olan MiniCPM5-1B, 1,08 milyar parametre sahibi ve temel mimarisi standart LlamaForCausalLM üzerine kuruludur; bu da alt seviye entegrasyon ve çıkarım dağıtımını büyük ölçüde kolaylaştırmıştır. Artificial Analysis testlerinde model, 18 puanla 2B boyutundaki Qwen3.5-2B’yi (16 puan) geçti ve Qwen3.5-0.8B’yi (11 puan) ile LFM2.5-1.2B-Thinking’i (8 puan) geride bıraktı. Model, MLX 4-bit ve GGUF Q4_K_M gibi dağıtım formatlarını destekliyor, INT4 kuantizasyonu sonrası ağırlıkları yalnızca 0,5 GB ve 131.072 token uzunlukta metin bağlamını doğrudan destekliyor; ayrıca enable_thinking tabanlı karışık çift modlu çıkarımı sağlıyor. Çok düşük donanım maliyeti sayesinde, OpenBMB aynı zamanda tamamen çevrimdışı çalışan masaüstü açılır pencere eşlik uygulaması MiniCPM Desk Pet’i de açık kaynaklı hale getirdi; bu uygulama Cursor gibi geliştirme araçlarında kodlama etkinliklerini gerçek zamanlı olarak yanıtlamayı ve LoRA karakter değişimlerini destekliyor. (Kaynak: BlockBeats)
Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.