ข่าวจาก ME News เมื่อวันที่ 29 พฤษภาคม (UTC+8) ตามการติดตามของ Beating ทีมแอปพลิเคชันโมเดลขนาดใหญ่ของ Xiaomi ได้เปิดตัวและเปิดแหล่งที่มาของกรอบงานสร้างเสียงและเอฟเฟกต์เสียงสำหรับวิดีโอชื่อ ControlFoley 以往 AI สำหรับเสียงพากย์วิดีโอส่วนใหญ่จะพึ่งพาโมเดลในการคาดเดาเสียงจากภาพ ทำให้ผู้สร้างยากที่จะควบคุมรูปแบบเสียงได้อย่างแม่นยำ จุดเด่นของ ControlFoley คือ “ความสามารถในการควบคุม”: มันสามารถสร้างเสียงตามภาพได้ พร้อมทั้งรับคำอธิบายด้วยข้อความหรือเสียงอ้างอิง เพื่อให้เสียงถูกสร้างตามเจตนาของผู้สร้าง เช่น เปลี่ยนเสียงเคาะประตูให้เป็น “เสียงตีโลหะ” หรือใช้จังหวะกลองเพื่อจับคู่กับการตีเทนนิส โมเดลสามารถรักษาความสอดคล้องระหว่างเสียงและภาพได้ในขณะเดียวกันก็สอดคล้องกับรูปแบบที่ระบุไว้ ในระดับพื้นฐาน ControlFoley ใช้ตัวเข้ารหัสวิดีโอและเสียงแบบ时空ที่ปรับปรุงจาก CAV-MAE และนำกลยุทธ์ “การแยกเวลา-โทนเสียง” มาใช้ โดยมอบเวลาการเกิดเสียงให้กับวิดีโอ และมอบรูปแบบโทนเสียงให้กับเสียงอ้างอิง ในการประเมินหลายภารกิจตามที่กำหนดในบทความวิจัย ControlFoley บรรลุระดับ SOTA สำหรับแหล่งที่มาเปิดในหลายการทดสอบพากย์วิดีโอทั่วไป แม้คำสั่งข้อความจะขัดแย้งอย่างรุนแรงกับเนื้อหาภาพ โมเดลยังสามารถรักษาทั้งการปฏิบัติตามข้อความและการซิงค์เวลาได้ เมื่อเทียบกับระบบเชิงพาณิชย์ที่ปิดแหล่งที่มาอย่าง Kling-Foley ControlFoley มีความสามารถแข่งขันในหลายดัชนี เช่น การจับคู่เชิงความหมาย การซิงค์ และคุณภาพเชิงรับรู้ แต่ยังมีช่องว่างในบางดัชนีการจับคู่ KL divergence ภายใต้ Kling-Audio-Eval และ MovieGen-Audio-Bench ปัจจุบัน เอกสารเทคนิค โค้ด น้ำหนักโมเดล และ Demo ของโครงการได้เปิดให้เข้าถึงแล้ว (ที่มา: BlockBeats)
Xiaomi เปิดแหล่งที่มาของกรอบงานการสร้างเสียงวิดีโอ ControlFoley
KuCoinFlashแชร์






ทีมโมเดลขนาดใหญ่ของ Xiaomi เปิดตัวกรอบงานการสร้างเสียงจากวิดีโอ ControlFoley เมื่อวันที่ 29 พฤษภาคม โมเดลนี้รองรับการป้อนข้อมูลภาพ คำสั่งข้อความ หรือเสียงอ้างอิงเพื่อควบคุมรูปแบบเสียง โดยใช้กลยุทธ์การแยกเวลาและโทนเสียง พร้อมตัวเข้ารหัส CAV-MAE ที่ปรับปรุงแล้ว ประสิทธิภาพอยู่ในระดับชั้นนำในการทดสอบเสียงจากวิดีโอ แม้จะตามหลังเล็กน้อยในค่า KL divergence นักเทรดที่ใช้การวิเคราะห์เปิดตำแหน่งอาจพบว่าการพัฒนานี้เกี่ยวข้องกับการลงทุนตามมูลค่าในคริปโต
แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้
การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา