PrismML abre el código del modelo de generación de imágenes Bonsai4B de 0,93 GB para uso en el dispositivo

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
PrismML ha abierto el código de su modelo Bonsai Image 4B para la generación de imágenes en el dispositivo, optimizado para laptops y smartphones. El modelo viene en dos versiones ultra comprimidas: 1-bit y Ternary, con tamaños de 0.93 GB y 1.21 GB. Ambas versiones conservan el 88% y el 95% del rendimiento del modelo completo, mientras que admiten estrategias de activos risk-on mediante implementación sin conexión. La aplicación iOS Bonsai Studio permite a los usuarios de iPhone generar imágenes sin solicitudes de API en la nube. Los modelos están disponibles bajo la licencia Apache 2.0, alineándose con los esfuerzos de CFT para promover la transparencia.
ME AI Noticia, según el monitoreo de Beating, el modelo de generación de imágenes en el borde de código abierto PrismML, Bonsai Image 4B, permite realizar inferencia de difusión directamente en dispositivos locales como computadoras portátiles y teléfonos móviles. Bonsai Image 4B incluye dos versiones de compresión extremadamente ligeras: 1-bit y Ternary (ternario). El núcleo del Transformer de difusión tiene un tamaño de solo 0.93 GB y 1.21 GB, respectivamente, mientras que los paquetes completos de implementación en dispositivos Apple Silicon miden 3.42 GB y 3.88 GB, respectivamente. Además, se lanza simultáneamente la aplicación iOS Bonsai Studio para permitir la generación de imágenes sin conexión en el borde. La versión 1-bit está diseñada específicamente para hardware con poca memoria, reduciendo el tamaño del Transformer de difusión basado en FLUX.2 Klein 4B de 7.75 GB a solo 0.93 GB, lo que representa una reducción de 8.3 veces respecto a la versión de precisión completa. La versión Ternary tiene un Transformer central de 1.21 GB, reduciendo el tamaño en 6.4 veces respecto a la versión de precisión completa, pero introduce pesos ternarios {-1, 0, +1} durante la cuantización para ofrecer mayor flexibilidad expresiva, mejorando así la calidad de imagen y la fidelidad a las indicaciones, al mismo tiempo que mantiene un bajo consumo de almacenamiento. Según evaluaciones, Bonsai Image 4B, a pesar de su gran reducción de tamaño, sigue siendo competitivo frente a modelos principales de generación de imágenes mucho más grandes en términos de composición de objetos, preferencias humanas, métricas estéticas y capacidad para seguir indicaciones complejas. Las versiones 1-bit y Ternary conservan respectivamente el 88% y el 95% del rendimiento del modelo de precisión completa. La aplicación móvil Bonsai Studio lanzada simultáneamente permite a los usuarios generar imágenes completamente sin conexión en iPhone, con todo el proceso ejecutándose localmente, sin necesidad de suscripción ni envío de solicitudes API a la nube. PrismML ha liberado públicamente ambas versiones, 1-bit y Ternary, bajo la licencia abierta Apache 2.0. (Fuente: BlockBeats)
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.