Google DeepMind เปิดตัว DiffusionGemma ความเร็วในการสร้างข้อความเพิ่มขึ้น 4 เท่า

iconKuCoinFlash
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
ข่าวบนโซ่: Google DeepMind เปิดตัว DiffusionGemma โมเดลการสร้างข้อความแบบเปิดแหล่งที่มา ซึ่งเร่งความเร็วขึ้น 4 เท่า โดยใช้เทคโนโลยีการแพร่กระจาย สร้างโทเค็น 256 ตัวพร้อมกัน ได้มากกว่า 1000 โทเค็น/วินาทีบน H100 และมากกว่า 700 บน RTX 5090 โมเดล 26B MoE ใช้งานพารามิเตอร์ 3.8B ในระหว่างการอนุมาน และรองรับ GPU สำหรับผู้บริโภคหลังจากการลดขนาดข้อมูล มีคุณสมบัติการให้ความสนใจแบบสองทิศทางและการแก้ไขตนเอง เหมาะสำหรับการเติมโค้ดและการแก้ไขแบบในบรรทัด โมเดลนี้เปิดแหล่งที่มาภายใต้ Apache 2.0 การเพิ่มโทเค็นใหม่อาจได้รับประโยชน์จากความก้าวหน้าด้านประสิทธิภาพการสร้างเช่นนี้
ME AI ข่าว: Google DeepMind เปิดตัวโมเดลทดลองแบบเปิดแหล่งที่มา DiffusionGemma ที่ใช้เทคโนโลยีการกระจายข้อความ ซึ่งทำลายวิธีการสร้างทีละ token แบบอนุกรม โดยสามารถสร้าง token ได้พร้อมกัน 256 ตัวในแต่ละครั้ง โมเดล 26B MoE นี้เมื่อใช้งานจริงจะเปิดใช้งานพารามิเตอร์เพียง 3.8B เท่านั้น และเมื่อถูกควอนไทซ์แล้วสามารถทำงานได้บน GPU ระดับผู้บริโภคที่มีหน่วยความจำ 18GB โดยมีความเร็วถึง 1,000+ tokens/s บน H100 และ 700+ tokens/s บน RTX 5090 เพิ่มขึ้น 4 เท่า มีความสามารถในการให้ความสนใจแบบสองทิศทางและการแก้ไขตนเอง โดยออกแบบมาสำหรับงานโต้ตอบแบบโลคัล เช่น การแก้ไขแบบในบรรทัดและการเติมโค้ด และเปิดให้ใช้งานภายใต้ใบอนุญาต Apache 2.0 (ที่มา: AiHot)
แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา