ChainThink melaporkan, pada 17 Mac, penerbit stablecoin Tether mengumumkan pelancaran QVAC Fabric, platform AI pertama di dunia yang menyediakan kerangka kerja LoRA lintas platform untuk Microsoft BitNet (1-bit LLM), membolehkan model bahasa berskala miliaran parameter dilatih dan dijalankan pada peranti biasa, termasuk laptop, GPU peringkat pengguna, dan telefon pintar.
Pihak rasmi menyatakan bahawa rangka kerja ini secara signifikan mengurangkan sempadan memori grafik dan kuasa pengiraan yang diperlukan untuk melatih model AI, menyokong Intel, AMD, Apple Silicon, serta pelbagai GPU mudah alih (seperti Adreno, Mali, Apple Bionic).
Dalam ujian, model BitNet dengan sekitar 125 juta parameter dapat dituning dalam masa sekitar 10 minit di Samsung S25; model dengan 1 bilion parameter memerlukan sekitar 1 jam 18 minit di Samsung S25 dan sekitar 1 jam 45 minit di iPhone 16, dan pasukan berjaya menyesuaikan model dengan 13 bilion parameter di iPhone 16.
Dari segi prestasi, kelajuan inferens model BitNet pada GPU mudah alih boleh meningkat 2 hingga 11 kali ganda berbanding CPU. Sementara itu, ujian menunjukkan bahawa BitNet-1B boleh mengurangkan penggunaan memori VRAM sehingga 77.8% berbanding model 16-bit dalam tugas inferens dan penyesuaian halus.
Paolo Ardoino menyatakan bahawa teknologi ini bertujuan untuk mengurangkan ketergantungan kepada komputasi awan berskala besar dan peranti AI khas, membolehkan latihan model AI dilakukan di peranti tempatan serta menyediakan asas untuk model baharu seperti AI terdesentralisasi dan pembelajaran federated.
