Selon les nouvelles de ME, le 21 avril (UTC+8), selon les données surveillées par Beating, Moondream a lancé le service de fine-tuning Lens, qui résout le problème de la « dernière mile » — à savoir l'insuffisance de précision des modèles de vision et de langage (VLM, des modèles d'IA capables de lire des images et d'y répondre par texte) lors de leur passage du laboratoire à la production. Lens est une API payante à l'utilisation, prenant en charge à la fois l'apprentissage par renforcement et le fine-tuning supervisé ; selon l'entreprise, des résultats visibles peuvent être obtenus avec seulement une dizaine d'images. Une fois l'entraînement terminé, le modèle peut être appelé via le cloud ou exécuté localement avec le moteur d'inférence Photon de l'entreprise. Moondream a publié trois jeux de données comparatives. Dans la détection des joueurs en possession du ballon lors de diffusions NBA, le modèle de base produisait un grand nombre de faux positifs ; après fine-tuning avec RL, le F1 est passé de 28 % à 79 %, et le nombre de cadres erronés est tombé de 61 à 2, avec un temps d'entraînement de 54 minutes et un coût de 16,89 dollars. Dans la tâche d'identification du pays à partir de photos de rue, 25 images par pays pour le fine-tuning ont permis d'atteindre une précision de 71,1 %, dépassant les 69,8 % de GPT-5.4. En imagerie médicale, après fine-tuning, la précision du modèle pour classer la gravité du glaucome est deux fois supérieure à celle de GPT-5.4, avec un temps d'entraînement de 47 minutes et un coût de 15,68 dollars. Le premier partenaire est PTZOptics, fabricant de caméras à plateau télécommandé en cloud, qui utilise Moondream pour suivre des cibles spécifiques (par exemple « une personne portant une veste rouge »), compter les éléments visuels et déclencher des alertes d'anomalies. Moondream avait déjà publié son moteur d'inférence Photon, avec une latence d'inférence de 20 millisecondes sur H100 selon les chiffres officiels. Lens se concentre sur la précision, tandis que Photon vise la vitesse ; Moondream propose ainsi des solutions aux deux obstacles courants rencontrés lors du déploiement industriel des VLM. (Source : BlockBeats)
Moondream lance le service de fine-tuning VLM Lens pour améliorer la précision
KuCoinFlashPartager






Moondream a lancé un service de fine-tuning VLM appelé Lens le 21 avril (UTC+8) pour améliorer la précision dans les applications du monde réel. Lens est une API au forfait qui prend en charge l'apprentissage par renforcement et le fine-tuning supervisé, avec des résultats visibles à partir d'une douzaine d'images. L'entraînement est disponible via le cloud ou localement à l'aide du moteur d'inférence Photon. L'entreprise a partagé des données montrant une précision améliorée dans la détection NBA, la reconnaissance de scènes de rue et la classification du glaucome. PTZOptics, un fabricant de caméras PTZ, est le premier partenaire à utiliser Moondream pour le suivi et les alertes. Les actualités sur chaîne mettent en lumière l'adoption croissante des outils d'IA dans les environnements de production. Les données sur l'inflation restent un facteur macroéconomique clé pour les marchés cryptos.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.