ตามการตรวจสอบของ Beating ทีม Qwen ของ Alibaba ประกาศเปิดใช้งานแคชแบบซ่อนอัตโนมัติให้กับโมเดลหลัก Qwen3.7-Max บนแพลตฟอร์ม BaiLian ของ Alibaba Cloud โดยนักพัฒนาไม่จำเป็นต้องแก้ไขโค้ดหรือระบุพารามิเตอร์เพิ่มเติม สามารถใช้งานแคชเพื่อลดต้นทุนได้ทันที ภายใต้กลไกการคิดค่าบริการใหม่นี้ ระบบจะระบุและดึงข้อมูลส่วนหัวของบริบทซ้ำซ้อนในคำขออัตโนมัติ เมื่อเกิดการแคชที่ตรงกัน ค่าใช้จ่ายสำหรับโทเค็นอินพุตที่ถูกแคชจะคิดเพียง 20% ของราคาต่อหน่วยเดิม ลดต้นทุนอินพุตไปถึง 80% โดยตรง แคชแบบซ่อนนี้ถูกออกแบบมาเพื่อจัดการกับค่าใช้จ่ายสูงในสถานการณ์ข้อความยาวและตัวแทน AI โดย Qwen3.7-Max ที่มีหน้าต่างบริบทยาวถึง 1 ล้านโทเค็น เมื่อทำงานในภารกิจขั้นสูงเช่นการเขียนโค้ดอัตโนมัติ จะต้องอ่านฐานข้อมูลโค้ดหรือเอกสารความรู้ขนาดใหญ่อย่างถี่ถ้วนและซ้ำๆ นักพัฒนาคนหนึ่งรายงานว่าหลังทดสอบ Qwen3.7 เขาใช้เวลาไม่ถึงหนึ่งชั่วโมงในการสร้างเว็บเดโม่เกม坦克大战 (Tank Battle) และใช้โทเค็นใกล้เคียง 1 ล้านโทเค็น หากปล่อยให้ตัวแทน AI ทำงานอัตโนมัติในพื้นหลังเพื่อตรวจสอบโค้ดและวนซ้ำอย่างต่อเนื่อง การใช้งานรายวันสามารถพุ่งสูงถึงหลายร้อยล้านโทเค็นได้อย่างง่ายดาย การแข่งขันด้านราคาแคชจากคู่แข่งเป็นอีกปัจจัยสำคัญที่ผลักดันให้อลีบาบาลดราคา ก่อนหน้านี้ DeepSeek V4-Pro ดึงดูดนักพัฒนาจำนวนมากด้วยราคาแคชที่ต่ำมาก หลังประกาศลดราคาถาวรเมื่อปลายเดือนพฤษภาคม ค่าใช้จ่ายสำหรับการแคชที่ตรงกันของ DeepSeek V4-Pro ถูกปรับเหลือเพียง 0.003625 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น (ประมาณ 0.025 หยวนจีน) ซึ่งเทียบเท่ากับการลดต้นทุนไปถึง 99.17% จากราคาอินพุตมาตรฐาน นักพัฒนาจำนวนมากใช้เครื่องมือเฉพาะอย่าง Reasonix เพื่อเพิ่มอัตราการแคชที่ตรงกันในแต่ละครั้งสูงสุดถึง 99% ทำให้บิลการใช้งานตัวแทน AI ในเซสชันยาวแทบเป็นศูนย์ เพื่อรับมือกับแรงกดดันจากการแข่งขัน Qwen3.7-Max ไม่เพียงแต่เปิดใช้งานแคชแบบซ่อนที่ไม่ต้องตั้งค่าใดๆ เท่านั้น แต่ยังคงรักษาโหมดแคชแบบชัดเจนที่ต้องประกาศค่า cache_control โดยเทียบกับแคชแบบอัตโนมัติ แคชแบบชัดเจนมีความแม่นยำในการตรงกันสูงกว่า และค่าใช้จ่ายเมื่อเกิดการแคชที่ตรงกันลดลงเหลือเพียง 10% ของราคาอินพุตมาตรฐาน (ส่วนลด 90%) แต่ต้องจ่ายค่าปรับเพิ่ม 125% ในครั้งแรกที่สร้างแคช และอายุการใช้งานของบล็อกแคชมีเพียง 5 นาที (แต่ละครั้งที่เกิดการแคชที่ตรงกันจะรีเซ็ตเวลาใหม่)
Aliyun เปิดตัวการแคชแบบไม่เปิดเผยสำหรับ Qwen3.7-Max ลดค่าใช้จ่ายในการป้อนข้อมูลได้สูงสุด 80%
MarsBitแชร์






Aliyun เปิดตัวการแคชแบบไม่ระบุสำหรับ Qwen3.7-Max ลดต้นทุนการป้อนข้อมูลลงถึง 80% การอัปเดตนี้ใช้งานได้แล้วบน BaiLian โดยไม่ต้องเปลี่ยนโค้ด ค่าใช้จ่ายเมื่อแคชสำเร็จอยู่ที่ 20% ของโทเค็นการป้อนข้อมูล เหมาะสำหรับงานที่เกี่ยวข้องกับข้อความยาวและงานตัวแทน การเพิ่มโทเค็นใหม่อาจได้รับประโยชน์จากประสิทธิภาพที่เพิ่มขึ้นนี้ โมเดลนี้ยังรองรับการแคชแบบระบุที่ 10% แต่ต้องตั้งค่าด้วยตนเอง ข่าวราคาคริปโตมักเน้นนวัตกรรมที่ขับเคลื่อนด้วยต้นทุนเช่นนี้
แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้
การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา