Tether Meluncurkan Kerangka Kerja BitNet LoRA lintas platform untuk melatih model AI berparameter miliaran di perangkat konsumen

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Tether mengumumkan kerangka kerja BitNet LoRA lintas platform untuk berita on-chain dan berita AI + kripto, memungkinkan model AI berparameter miliaran untuk dilatih di perangkat konsumen. Kerangka kerja ini, bagian dari QVAC Fabric, mengoptimalkan BitNet milik Microsoft untuk penggunaan komputasi dan memori yang rendah. Kerangka ini mendukung Adreno, Mali, Apple Bionic, dan lainnya, dengan model 1B yang disesuaikan dalam sekitar satu jam. Perangkat non-NVIDIA kini mendukung pelatihan LLM 1-bit. Model BitNet berjalan 2–11x lebih cepat di GPU seluler dibandingkan CPU, menggunakan 77,8% lebih sedikit VRAM daripada model 16-bit. Tether menyatakan teknologi ini mengurangi ketergantungan pada cloud dan mendukung pelatihan AI terdesentralisasi.

Odaily Planet Daily melaporkan, menurut pengumuman resmi, Tether mengumumkan peluncuran kerangka kerja fine-tuning BitNet LoRA di QVAC Fabric, yang mengoptimalkan pelatihan dan inferensi untuk Microsoft BitNet (1-bit LLM). Kerangka kerja ini secara signifikan mengurangi kebutuhan daya komputasi dan memori, memungkinkan model dengan parameter miliaran untuk dilatih dan disesuaikan di laptop, GPU konsumen, dan smartphone.

Solusi ini pertama kali memungkinkan fine-tuning model BitNet pada GPU seluler (termasuk Adreno, Mali, dan Apple Bionic). Pengujian menunjukkan bahwa model dengan 125M parameter dapat selesai fine-tuning dalam sekitar 10 menit, model 1B dalam sekitar 1 jam, dan bahkan dapat diskalakan hingga model 13B parameter di perangkat seluler.

Selain itu, kerangka ini mendukung perangkat keras heterogen seperti Intel, AMD, dan Apple Silicon, serta pertama kalinya mewujudkan fine-tuning LoRA 1-bit pada perangkat non-NVIDIA. Dari segi kinerja, model BitNet meningkatkan kecepatan inferensi hingga 2 hingga 11 kali lipat pada GPU seluler dibandingkan CPU, sekaligus mengurangi penggunaan memori GPU hingga 77,8% dibandingkan model 16-bit tradisional.

Tether menyatakan bahwa teknologi ini berpotensi mengurangi ketergantungan pada kekuatan komputasi tinggi dan infrastruktur cloud, mendorong pelatihan AI menuju desentralisasi dan lokalization, serta menyediakan dasar untuk aplikasi baru seperti federated learning.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.