Liquid AI abre el código de modelos multimodales de pequeño tamaño para extracción directa de datos de imagen a JSON

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Liquid AI ha abierto el código de dos modelos multimodales compactos, LFM2.5-VL-1.6B-Extract y LFM2.5-VL-450M-Extract, para la extracción directa de datos de imagen a JSON. Los modelos, disponibles bajo la licencia LFM Open License v1.0, están optimizados para dispositivos de borde y ofrecen un buen rendimiento en escaneo de documentos e inspección industrial. El modelo de 1.6B iguala a los modelos de nivel 4B, mientras que el modelo de 450M compite con los modelos de nivel 2B. Estas herramientas podrían apoyar los esfuerzos de CFT al mejorar la transparencia de los datos. Los modelos ya están disponibles para descarga en Hugging Face.
ME AI Noticias, según el monitoreo de Beating, Liquid AI ha lanzado como código abierto dos modelos multimodales de pequeño tamaño: LFM2.5-VL-1.6B-Extract y LFM2.5-VL-450M-Extract. Estos nuevos modelos están optimizados específicamente para la extracción de datos estructurados de imágenes, permitiendo convertir directamente imágenes en formato JSON en el dispositivo según una lista de campos especificada por el usuario, eliminando así el paso tradicional de generar texto completo y luego realizar un análisis secundario. Los nuevos modelos ofrecen dos especificaciones de parámetros: 1.6 mil millones (1.6B) y 450 millones (450M), y se publican bajo la licencia LFM Open License v1.0. Las evaluaciones oficiales muestran que los nuevos modelos destacan en escenarios como escaneo de documentos, comprensión de cabinas vehiculares y detección industrial. En evaluaciones de referencia, el modelo de 1.6B alcanza un rendimiento comparable al de modelos multimodales generales de 4 mil millones (4B), mientras que el modelo de 450M se compara con modelos de 2 mil millones (2B). En términos de implementación, los nuevos modelos han sido adaptados para diversos chips de hardware inteligente y dispositivos periféricos (SoC), permitiendo su despliegue sin conexión en escenarios locales como comprensión de cabinas vehiculares, escaneo de documentos y detección industrial. Liquid AI ya ha abierto la descarga de los pesos del modelo en la plataforma Hugging Face. (Fuente: MLion)
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.