กูเกิลเปิดตัวกลยุทธ์การตั้งราคา Gemini API ใหม่ด้วยตัวเลือกบริการแบบระดับชั้น

iconMetaEra
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
Google เปิดตัวราคา API ใหม่สำหรับ Gemini พร้อมห้าระดับ: Standard, Flexible, Batch, Priority และ Cache โดย Flexible และ Batch ให้ส่วนลด 50% สำหรับการประมวลผลแบบความล่าช้าต่ำ (1–15 นาที) และการประมวลผลแบบแบตช์ (สูงสุด 24 ชั่วโมง) ส่วน Cache เก็บค่าตามจำนวนโทเค็นและระยะเวลาการจัดเก็บ ส่วน Priority ซึ่งสูงกว่า 75%–100% มุ่งเน้นไปที่ความต้องการแบบเรียลไทม์ การอัปเดตนี้สอดคล้องกับการเพิ่มรายการโทเค็นใหม่และแนวโน้มข้อมูลเงินเฟ้อ เพื่อปรับปรุงการจัดตารางการประมวลผล AI ให้สอดคล้องกับความต้องการด้านต้นทุนและความล่าช้าที่หลากหลาย
Google เพิ่งอัปเดตรูปแบบการคิดค่าบริการของ Gemini API โดยเปิดตัวห้าระดับบริการ: มาตรฐาน ยืดหยุ่น ลำดับความสำคัญ สูงสุด และแคช ระดับยืดหยุ่นและสูงสุดเสนอส่วนลด 50% จากอัตรามาตรฐาน ซึ่งเหมาะกับสถานการณ์ที่ไม่ไวต่อความล่าช้า (1–15 นาที) และการประมวลผลข้อมูลขนาดใหญ่มาก (ความล่าช้าสูงสุด 24 ชั่วโมง) ตามลำดับ; ระดับแคชคิดค่าบริการตามจำนวนโทเค็นและระยะเวลาการจัดเก็บ เหมาะสำหรับการเรียกใช้คำสั่งที่ซับซ้อนและถี่; ระดับลำดับความสำคัญมีค่าใช้จ่ายเพิ่มขึ้น 75%–100% เพื่อรับประกันการตอบสนองในระดับมิลลิวินาทีถึงวินาที สำหรับแอปพลิเคชันสำคัญเช่น บอทบริการลูกค้าและการตรวจจับการฉ้อโกงแบบเรียลไทม์ การปรับเปลี่ยนครั้งนี้เสริมสร้างความสามารถในการจัดสรรทรัพยากรแบบมีระดับสำหรับบริการการประมวลผล AI และมอบโมเดลการกำหนดราคาทรัพยากรคำนวณที่ละเอียดยิ่งขึ้นสำหรับแอปพลิเคชัน AI ที่มีความไวต่อความล่าช้าและข้อจำกัดด้านต้นทุนต่างกัน

ผู้เขียนบทความ แหล่งที่มา: AIBase

Google เพิ่งอัปเดตรูปแบบการคิดค่าบริการสำหรับ Gemini API เพื่อตอบสนองความต้องการในการใช้งานการประมวลผลของผู้ใช้ให้ดียิ่งขึ้น การอัปเดตนี้ได้นำเสนอระดับบริการใหม่หลายแบบ ได้แก่ แบบมาตรฐาน แบบยืดหยุ่น แบบลำดับความสำคัญ แบบแบตช์ และแบบแคช ผู้ใช้สามารถเลือกระดับที่เหมาะสมที่สุดตามความต้องการจริงของตนเอง

ก่อนอื่น ระดับมาตรฐานให้บริการการประมวลผลพื้นฐาน โดยผู้ใช้สามารถเลือกตามความต้องการการใช้งานของตนเอง ส่วนระดับยืดหยุ่นเป็นตัวเลือกที่สร้างสรรค์ ซึ่งใช้ทรัพยากรหน่วยประมวลผลที่ว่างอยู่ในช่วงนอกชั่วโมงเร่งด่วน เพื่อเสนอส่วนลด 50% จากราคามาตรฐาน ระดับนี้มีเป้าหมายความล่าช้าอยู่ระหว่าง 1 ถึง 15 นาที แต่ไม่รับประกันเวลาความล่าช้าที่แน่นอน เหมาะสำหรับการใช้งานที่ไม่ต้องการความแม่นยำด้านเวลาอย่างเข้มงวด

นอกจากนี้ ระดับการซื้อแบบกลุ่มยังให้ส่วนลด 50% สำหรับอัตราค่าบริการมาตรฐาน เหมาะสำหรับผู้ใช้ที่ต้องจัดการข้อมูลจำนวนมาก โดยเวลาหน่วงสามารถยาวได้สูงสุด 24 ชั่วโมง ระดับนี้เหมาะเป็นพิเศษสำหรับสถานการณ์การประมวลผลข้อมูลขนาดใหญ่ ช่วยให้ผู้ใช้ประหยัดค่าใช้จ่ายอย่างมากเมื่อสอบถามข้อมูลจำนวนมาก

ในระดับแคช การคิดค่าบริการจะอิงจากจำนวนโทเค็นที่แคชและระยะเวลาที่เก็บไว้ เหมาะอย่างยิ่งสำหรับโรบอตการสนทนาที่ต้องเรียกใช้คำสั่งซับซ้อนบ่อยครั้ง การวิเคราะห์วิดีโอความยาว หรือการสอบถามชุดเอกสารขนาดใหญ่ ระดับนี้ช่วยให้ผู้ใช้สามารถจัดการทรัพยากรการจัดเก็บและการคำนวณได้อย่างมีประสิทธิภาพ และเพิ่มประสิทธิภาพการทำงานของระบบ

ราคาสำหรับระดับพรีเมียมสูงกว่าราคามาตรฐานอยู่ 75% ถึง 100% แต่สามารถควบคุมความล่าช้าในช่วงมิลลิวินาทีถึงวินาที ระดับนี้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการการตอบสนองแบบเรียลไทม์ เช่น แชทบอทบริการลูกค้า การตรวจจับการฉ้อโกงแบบเรียลไทม์ และผู้ช่วยปัญญาประดิษฐ์สำหรับธุรกิจที่สำคัญ โกลเกลแนะนำให้ผู้ใช้ที่มีความต้องการเลือกระดับพรีเมียมเพื่อให้มั่นใจว่าแอปพลิเคชันของพวกเขาจะมีประสิทธิภาพและความเร็วในการตอบสนองที่ดีที่สุด

เน้นจุดสำคัญ:

🌟 เพิ่มระดับบริการ Gemini API หลายระดับ เพื่อตอบสนองความต้องการของผู้ใช้ที่หลากหลาย

⏳ ระดับยืดหยุ่นและระดับแบบกลุ่มให้ส่วนลด 50% เหมาะสำหรับการประมวลผลข้อมูลขนาดใหญ่

⚡ ระดับความสำคัญสูงสุดรับประกันการตอบสนองในระดับมิลลิวินาที เหมาะสำหรับการใช้งานแบบเรียลไทม์

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา