ChainThink mesajı, 1M AI News'in izlemesine göre, 1 Nisan 2026 tarihinde, Kaliforniya Teknoloji Enstitüsü matematikçisi Babak Hassibi'nin ortak kurucusu olduğu AI laboratuvarı PrismML, gizli dönemini sona erdirdi ve 1-bit Bonsai serisi büyük dil modellerini açık kaynak hale getirdi. Ana model olan 1-bit Bonsai 8B, 8,2 milyar parametreye sahiptir ve yalnızca 1,15 GB bellek tüketir; aynı sınıftaki 16-bit modellere göre yaklaşık 14 kat daha sıkıştırılmıştır. Aynı zamanda, 4B (0,5 GB) ve 1,7B (0,24 GB) olmak üzere daha küçük iki model de duyuruldu.
Bonsai 8B, sonundan sonuna kadar gerçek 1-bit bir modeldir; gömme katmanı, dikkat katmanı, MLP katmanı ve çıktı başlığı tümü yalnızca +1 veya -1 ile temsil edilir, yüksek hassasiyetli düzeltmeler yoktur. PrismML, bu modelin standart benchmark testlerindeki çıkarım ve dil anlama yeteneklerinin 16-bit tam hassasiyetli modellere eşit olduğunu belirtiyor. Temel sıkıştırma matematiği, ekip tarafından Caltech'te yıllarca geliştirildi ve mülkiyet Caltech'e aittir; PrismML, tek özel lisans sahibidir. Model, Google v4 TPU ile eğitilmiştir.
M4 Pro Mac'ta gerçek zamanlı hız 136 tok/s, RTX 4090'ta 440 tok/s, iPhone 17 Pro Max'te yaklaşık 44 tok/s olarak ölçüldü. Standart 16-bit 8B modeli hiçbir iPhone'a sığdıramazsınız; enerji tüketimi 16-bit modellere göre yaklaşık 4-5 kat azalmıştır. PrismML, mevcut donanımların 1-bit çıkarım için tasarlanmadığını belirtiyor; hız ve enerji avantajları ana olarak bellek kullanımındaki azalmadan kaynaklanıyor. Gelecekte 1-bit için özel olarak tasarlanmış donanımlar ortaya çıkarsa, verimlilik bir sıralama daha artırılabilir.
PrismML, 16,25 milyon dolarlık SAFE ve tohum sermaye finansman turunu tamamladı; yatırımcılar Khosla Ventures, Cerberus Capital ve California Institute of Technology. Khosla Ventures kurucusu Vinod Khosla, bu başarının "küçük bir iyileştirme değil, büyük bir teknolojik atılım, matematiksel bir atılım, sadece başka bir küçük model değil" dedi.
