ข่าว ME วันที่ 14 พฤษภาคม (UTC+8) ตามการติดตามของ Beating Nous Research ได้เปิดตัวแนวทางการฝึกล่วงหน้าแบบใหม่สำหรับโมเดลขนาดใหญ่ชื่อว่า Token Stacking Training (TST) แนวทางนี้ใช้การบีบอัดและรวมคำที่อยู่ติดกันในช่วงเริ่มต้นของการฝึก ซึ่งสามารถลดเวลาการฝึกล่วงหน้าได้ 2 ถึง 3 เท่าภายใต้ปริมาณการคำนวณเท่าเดิม TST ประกอบด้วยสองขั้นตอน ในช่วง 20% ถึง 40% แรกของการฝึก โมเดลจะไม่อ่านคำทีละคำ แต่จะ “แพ็ก” คำที่อยู่ติดกันแล้วคำนวณค่าเฉลี่ยเพื่อป้อนเข้า และในส่วนเอาต์พุตจะทำนายว่าคำใดบ้างที่อยู่ในแพ็กถัดไป (โดยไม่คำนึงถึงลำดับภายใน) จากนั้น โมเดลจะกลับไปใช้การคาดการณ์คำถัดไปแบบปกติ เนื่องจากไม่มีการเปลี่ยนแปลงสถาปัตยกรรมพื้นฐาน โมเดลที่ได้จึงมีพฤติกรรมการให้บริการเหมือนกับโมเดลทั่วไปอย่างสมบูรณ์ วิธีนี้ได้รับการพิสูจน์แล้วบนโมเดล MoE ที่มีพารามิเตอร์สูงสุดถึง 10 พันล้านตัว แก่นแท้ของแนวทางนี้คือ “แลกข้อมูลเพื่อแลกพลังการคำนวณ” โดยเร่งความเร็วในการใช้ข้อมูลฝึกเพื่อประหยัดเวลาการคำนวณ หากในอนาคตข้อความคุณภาพสูงหมดลง คุณสมบัติในการใช้ข้อมูลอย่างรวดเร็วอาจกลายเป็นจุดอ่อน นอกจากนี้ ไม่กี่ชั่วโมงหลังจากเผยแพร่เอกสารวิจัย มีผู้อ่านระบุว่ากลไกของ TST มีความคล้ายคลึงอย่างมากกับงานก่อนหน้าที่เผยแพร่ในปี 2024 ชื่อ “Beyond Next Token Prediction” ทีมผู้เขียนจึงยอมรับบน Hugging Face ว่าเป็น “การวิจัยที่เกิดขึ้นพร้อมกันโดยบังเอิญ (convergent research)” และสัญญาว่าจะอัปเดตเอกสารเพื่อเพิ่มการอ้างอิงที่เกี่ยวข้อง (ที่มา: BlockBeats)
วิธีการฝึกอบรม TST ของ Nous Research สร้างความขัดแย้งเนื่องจากมีความคล้ายคลึงกับงานก่อนหน้า
KuCoinFlashแชร์






Nous Research เปิดตัวข่าวการเปิดตัวโทเค็นใหม่พร้อมวิธีการ Token Stacking Training (TST) เมื่อวันที่ 14 พฤษภาคม (UTC+8) โดยอ้างว่าสามารถลดเวลาการฝึกล่วงหน้าได้ 2 ถึง 3 เท่าภายใต้ภาระการคำนวณเดียวกัน วิธีนี้จะเรียงโทเค็นที่อยู่ติดกันในช่วงการฝึกเบื้องต้นและทำนายชุดโทเค็นแทนโทเค็นเดี่ยว ผู้วิจารณ์ทันทีชี้ให้เห็นความคล้ายคลึงของ TST กับบทความปี 2024 ที่ชื่อว่า 'Beyond Next Token Prediction' ทีมงานยอมรับความซ้ำซ้อนนี้เป็น 'การวิจัยที่เกิดขึ้นพร้อมกันโดยไม่ได้ตั้งใจ' และสัญญาว่าจะเพิ่มการอ้างอิงอย่างเหมาะสม การเปิดตัวโทเค็นใหม่มักเผชิญกับการตรวจสอบอย่างใกล้ชิด และกรณีนี้ก็ไม่ต่างกัน
แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้
การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา