Moondream Melancarkan Perkhidmatan Penyelarasan VLM Lens untuk Meningkatkan Ketepatan

iconKuCoinFlash
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Moondream melancarkan perkhidmatan penyesuaian VLM bernama Lens pada 21 April (UTC+8) untuk meningkatkan ketepatan dalam aplikasi dunia nyata. Lens ialah API bayar-seperti-anda-gunakan yang menyokong pembelajaran penguatan dan penyesuaian berarah, dengan keputusan yang boleh dilihat daripada belasan gambar. Latihan tersedia melalui awan atau secara tempatan menggunakan enjin inferensi Photon. Syarikat tersebut berkongsi data yang menunjukkan peningkatan ketepatan dalam pengesanan NBA, pengenalan adegan jalan, dan pengelasan glaukoma. PTZOptics, pembuat kamera PTZ, ialah rakan kongsi pertama yang menggunakan Moondream untuk pelacakan dan amaran. Berita di rantai menonjolkan peningkatan pengambilan alat AI dalam persekitaran pengeluaran. Data inflasi tetap menjadi faktor makro utama untuk pasaran kripto.

Berita ME, pada 21 April (UTC+8), menurut pemantauan Beating, Moondream melancarkan perkhidmatan fine-tuning Lens untuk menyelesaikan masalah "akhir kilometer" ketepatan yang tidak mencukupi apabila model bahasa visual (VLM), yang mampu membaca gambar dan menjawab dengan teks, berpindah dari makmal ke pengeluaran. Lens ialah API bayar mengikut penggunaan yang menyokong pembelajaran penguatan dan fine-tuning berpandukan, dengan pihak rasmi menyatakan kesan dapat dilihat dengan hanya beberapa belas gambar; selepas latihan selesai, ia boleh dipanggil melalui awan atau dijalankan secara tempatan menggunakan enjin inferens sendiri, Photon. Syarikat tersebut telah memaparkan tiga set data perbandingan. Dalam pengesanan pemain yang memegang bola dalam siaran langsung NBA, model asal sering menghasilkan banyak kotak salah positif; selepas fine-tuning dengan RL, F1 meningkat dari 28% kepada 79%, kotak salah positif berkurang dari 61 kepada 2, dengan masa latihan 54 minit dan kos $16.89. Dalam tugas mengenal pasti negara dari gambar jalan raya, setiap negara menggunakan 25 gambar sebagai sampel fine-tuning mencapai ketepatan 71.1%, melebihi GPT-5.4 pada 69.8%. Dalam imej perubatan, ketepatan model selepas fine-tuning dalam mengelas tahap keparahan glaukoma adalah dua kali ganda GPT-5.4, dengan masa latihan 47 minit dan kos $15.68. Pihak pertama yang bekerjasama ialah pengeluar kamera awan remote-control PTZOptics, yang menggunakan Moondream untuk melacak objek tertentu (contohnya, "orang yang memakai baju merah"), mengira kandungan gambar, dan menghantar amaran tidak normal. Moondream sebelum ini telah melancarkan enjin inferens Photon, dengan nombor rasmi menunjukkan latensi inferens 20 milisaat pada H100. Lens berfokus pada ketepatan, manakala Photon berfokus pada kelajuan; Moondream telah menghasilkan penyelesaian untuk dua titik penyekat umum dalam pelaksanaan VLM di persekitaran pengeluaran. (Sumber: BlockBeats)

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.