Google เพิ่งอัปเดตรูปแบบการคิดค่าบริการของ Gemini API โดยเปิดตัวห้าระดับบริการ: มาตรฐาน ยืดหยุ่น ลำดับความสำคัญ สูงสุด และแคช ระดับยืดหยุ่นและสูงสุดเสนอส่วนลด 50% จากอัตรามาตรฐาน ซึ่งเหมาะกับสถานการณ์ที่ไม่ไวต่อความล่าช้า (1–15 นาที) และการประมวลผลข้อมูลขนาดใหญ่มาก (ความล่าช้าสูงสุด 24 ชั่วโมง) ตามลำดับ; ระดับแคชคิดค่าบริการตามจำนวนโทเค็นและระยะเวลาการจัดเก็บ เหมาะสำหรับการเรียกใช้คำสั่งที่ซับซ้อนและถี่; ระดับลำดับความสำคัญมีค่าใช้จ่ายเพิ่มขึ้น 75%–100% เพื่อรับประกันการตอบสนองในระดับมิลลิวินาทีถึงวินาที สำหรับแอปพลิเคชันสำคัญเช่น บอทบริการลูกค้าและการตรวจจับการฉ้อโกงแบบเรียลไทม์ การปรับเปลี่ยนครั้งนี้เสริมสร้างความสามารถในการจัดสรรทรัพยากรแบบมีระดับสำหรับบริการการประมวลผล AI และมอบโมเดลการกำหนดราคาทรัพยากรคำนวณที่ละเอียดยิ่งขึ้นสำหรับแอปพลิเคชัน AI ที่มีความไวต่อความล่าช้าและข้อจำกัดด้านต้นทุนต่างกัน
ผู้เขียนบทความ แหล่งที่มา: AIBase
Google เพิ่งอัปเดตรูปแบบการคิดค่าบริการสำหรับ Gemini API เพื่อตอบสนองความต้องการในการใช้งานการประมวลผลของผู้ใช้ให้ดียิ่งขึ้น การอัปเดตนี้ได้นำเสนอระดับบริการใหม่หลายแบบ ได้แก่ แบบมาตรฐาน แบบยืดหยุ่น แบบลำดับความสำคัญ แบบแบตช์ และแบบแคช ผู้ใช้สามารถเลือกระดับที่เหมาะสมที่สุดตามความต้องการจริงของตนเอง
ก่อนอื่น ระดับมาตรฐานให้บริการการประมวลผลพื้นฐาน โดยผู้ใช้สามารถเลือกตามความต้องการการใช้งานของตนเอง ส่วนระดับยืดหยุ่นเป็นตัวเลือกที่สร้างสรรค์ ซึ่งใช้ทรัพยากรหน่วยประมวลผลที่ว่างอยู่ในช่วงนอกชั่วโมงเร่งด่วน เพื่อเสนอส่วนลด 50% จากราคามาตรฐาน ระดับนี้มีเป้าหมายความล่าช้าอยู่ระหว่าง 1 ถึง 15 นาที แต่ไม่รับประกันเวลาความล่าช้าที่แน่นอน เหมาะสำหรับการใช้งานที่ไม่ต้องการความแม่นยำด้านเวลาอย่างเข้มงวด
นอกจากนี้ ระดับการซื้อแบบกลุ่มยังให้ส่วนลด 50% สำหรับอัตราค่าบริการมาตรฐาน เหมาะสำหรับผู้ใช้ที่ต้องจัดการข้อมูลจำนวนมาก โดยเวลาหน่วงสามารถยาวได้สูงสุด 24 ชั่วโมง ระดับนี้เหมาะเป็นพิเศษสำหรับสถานการณ์การประมวลผลข้อมูลขนาดใหญ่ ช่วยให้ผู้ใช้ประหยัดค่าใช้จ่ายอย่างมากเมื่อสอบถามข้อมูลจำนวนมาก
ในระดับแคช การคิดค่าบริการจะอิงจากจำนวนโทเค็นที่แคชและระยะเวลาที่เก็บไว้ เหมาะอย่างยิ่งสำหรับโรบอตการสนทนาที่ต้องเรียกใช้คำสั่งซับซ้อนบ่อยครั้ง การวิเคราะห์วิดีโอความยาว หรือการสอบถามชุดเอกสารขนาดใหญ่ ระดับนี้ช่วยให้ผู้ใช้สามารถจัดการทรัพยากรการจัดเก็บและการคำนวณได้อย่างมีประสิทธิภาพ และเพิ่มประสิทธิภาพการทำงานของระบบ
ราคาสำหรับระดับพรีเมียมสูงกว่าราคามาตรฐานอยู่ 75% ถึง 100% แต่สามารถควบคุมความล่าช้าในช่วงมิลลิวินาทีถึงวินาที ระดับนี้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการการตอบสนองแบบเรียลไทม์ เช่น แชทบอทบริการลูกค้า การตรวจจับการฉ้อโกงแบบเรียลไทม์ และผู้ช่วยปัญญาประดิษฐ์สำหรับธุรกิจที่สำคัญ โกลเกลแนะนำให้ผู้ใช้ที่มีความต้องการเลือกระดับพรีเมียมเพื่อให้มั่นใจว่าแอปพลิเคชันของพวกเขาจะมีประสิทธิภาพและความเร็วในการตอบสนองที่ดีที่สุด
เน้นจุดสำคัญ:
🌟 เพิ่มระดับบริการ Gemini API หลายระดับ เพื่อตอบสนองความต้องการของผู้ใช้ที่หลากหลาย
⏳ ระดับยืดหยุ่นและระดับแบบกลุ่มให้ส่วนลด 50% เหมาะสำหรับการประมวลผลข้อมูลขนาดใหญ่
⚡ ระดับความสำคัญสูงสุดรับประกันการตอบสนองในระดับมิลลิวินาที เหมาะสำหรับการใช้งานแบบเรียลไทม์
