Redis บริษัทที่มีชื่อเสียงในด้านชั้นแคชที่ช่วยป้องกันแอปพลิเคชันเว็บไม่ให้ล้มเหลวภายใต้ปริมาณการใช้งานสูง กำลังเปลี่ยนทิศทางอย่างชัดเจนไปสู่โครงสร้างพื้นฐานด้านปัญญาประดิษฐ์มากขึ้น เมื่อวันจันทร์ที่ผ่านมา พวกเขาเปิดตัว Iris แพลตฟอร์มสำหรับบริบทและความจำที่ออกแบบมาเฉพาะสำหรับเอเจนต์ปัญญาประดิษฐ์ โดยมุ่งเป้าไปที่ความไม่สอดคล้องกันพื้นฐานระหว่างวิธีการที่เอเจนต์ใช้ข้อมูลกับวิธีการออกแบบระบบการดึงข้อมูลส่วนใหญ่
ทฤษฎีหลักนั้นเรียบง่าย: ตัวแทน AI ส่งคำขอข้อมูลมากกว่าผู้ใช้ทั่วไปหลายเท่า แต่ท่อการดึงข้อมูลส่วนใหญ่ถูกสร้างขึ้นเพื่อแก้ปัญหาในระดับของมนุษย์ Iris เป็นความพยายามของ Redis ในการปิดช่องว่างนี้ก่อนที่มันจะกลายเป็นจุดคอขวดที่ขัดขวางการนำ AI ไปใช้ในองค์กร
สิ่งที่ไอริสทำจริง
LLMs มีลักษณะไม่เก็บสถานะโดยธรรมชาติ การโต้ตอบทุกครั้งเริ่มต้นจากจุดเริ่มต้นใหม่ หากไม่มีสิ่งภายนอกใดให้ความต่อเนื่อง สิ่งภายนอกนั้นคือสิ่งที่ Iris ถูกออกแบบมาเพื่อเป็น
แพลตฟอร์มนี้อยู่ระหว่างตัวแทน AI กับข้อมูลที่มันต้องการเพื่อทำการกระทำ โดยรวมรวมความสามารถสามประการที่องค์กรมักต้องเชื่อมต่อจากเครื่องมือที่แยกจากกัน: Context Retriever, Agent Memory และ Data Integration
Context Retriever จัดการการดึงข้อมูลแบบเรียลไทม์ โดยดึงข้อมูลทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง เพื่อให้ตัวแทนสามารถอ้างอิงคำตอบจากข้อเท็จจริงปัจจุบันแทนที่จะอิงจากข้อมูลการฝึกอบรมที่มีอยู่เท่านั้น Agent Memory ให้การจัดเก็บข้อมูลทั้งระยะสั้นและระยะยาว หมายความว่าตัวแทนสามารถระลึกถึงสิ่งที่เกิดขึ้นในเซสชันก่อนหน้า ติดตามความชอบของผู้ใช้ที่เปลี่ยนแปลงไป หรือรักษาสถานะข้ามขั้นตอนการทำงานหลายขั้นตอน ชั้นข้อมูลแบบบูรณาการ ซึ่ง Redis เรียกว่า RDI ทำหน้าที่เป็นตัวโหลดข้อมูลแบบเรียลไทม์เพื่อให้ข้อมูลพื้นฐานยังคงทันสมัย
เหตุผลที่สิ่งนี้มีความสำคัญต่อโครงสร้างพื้นฐานของปัญญาประดิษฐ์
ไอริสยังมาพร้อมกับเวอร์ชัน Redis ใหม่ที่ใช้ SSD แบบ Flex ซึ่งบ่งชี้ว่าบริษัทกำลังพิจารณาทั้งประสิทธิภาพและประสิทธิภาพด้านต้นทุน การรันทุกอย่างในหน่วยความจำเร็วแต่ค่าใช้จ่ายสูง การมีชั้น SSD อาจทำให้องค์กรสามารถรักษาหน้าต่างบริบทที่ใหญ่ขึ้นและหน่วยความจำตัวแทนที่ยาวนานขึ้น โดยไม่ต้องพุ่งขึ้นอย่างมากต่อ ngânการโครงสร้างพื้นฐาน

