Redis,這家與緩存層緊密相關、曾協助網頁應用程式抵禦流量衝擊的公司,正大幅轉向 AI 基礎設施領域。週一,它推出了 Iris,這是一個專為 AI 代理設計的上下文與記憶平台,旨在解決代理資料使用方式與大多數檢索系統設計初衷之間的根本性不匹配問題。
核心論點很直接:AI 代理所發出的資料請求量比人類使用者高出數個數量級,但大多數檢索管道都是為人類規模的問題所設計。Iris 是 Redis 試圖在這成為阻礙企業 AI 採用的瓶頸之前,填補這一差距的嘗試。
Iris 實際上所做的事
大型語言模型本質上是無狀態的。每次互動都從頭開始,除非有外部因素提供連續性。而這個外部因素,正是 Iris 所設計的角色。
該平台位於 AI 執行個體與其行動所需的數據之間,整合了企業通常需從不同工具拼湊而成的三項功能:上下文檢索器、執行個體記憶與數據整合。
上下文檢索器負責實時數據獲取,提取結構化和非結構化信息,使代理能夠基於當前事實而非其訓練數據中隨機包含的內容來做出回應。代理內存提供短期和長期持久性,意味著代理可以回憶先前會話中的情況、追蹤用戶偏好的變化,或在多步工作流程中保持狀態。數據整合層(Redis 稱之為 RDI)作為實時數據加載器,確保底層信息保持新鮮。
這對 AI 基礎設施為何重要
Iris 同時搭載了基於 Flex SSD 的新版本 Redis,這表明公司正在兼顧成本效益與性能。全內存運行速度快但成本高昂,而 SSD 層級可能使企業能在不超出基礎設施預算的情況下,維持更大的上下文窗口和更長的代理記憶。

