Redis, syarikat yang dikaitkan dengan lapisan penjimatan yang mencegah aplikasi web runtuh di bawah trafik, sedang membuat lompatan tajam lebih dalam ke infrastruktur AI. Pada Isnin, ia melancarkan Iris, sebuah platform konteks dan memori yang direka khas untuk agen AI, menargetkan ketidaksesuaian asas yang dilihatnya antara cara agen mengambil data dan cara kebanyakan sistem pengambilan direka untuk menyediakannya.
Tesis utamanya ringkas: agen AI membuat permintaan data dalam ukuran yang jauh lebih besar berbanding pengguna manusia, tetapi kebanyakan saluran pemulihan dibina untuk masalah berskala manusia. Iris adalah usaha Redis untuk menutup jurang ini sebelum ia menjadi halangan yang menghambat pengambilan AI perniagaan.
Apa yang sebenarnya dilakukan oleh Iris
LLM secara intrinsik adalah tanpa keadaan. Setiap interaksi bermula dari awal kecuali jika sesuatu dari luar menyediakan kesinambungan. Sesuatu luaran itulah yang dirancang menjadi Iris.
Platform ini berada di antara agen AI dan data yang diperlukan untuk bertindak. Ia menggabungkan tiga kemampuan yang biasanya perlu dirangkai oleh perusahaan daripada alat-alat berasingan: Context Retriever, Agent Memory, dan Data Integration.
Context Retriever mengendalikan pengambilan data secara masa nyata, mengambil maklumat terstruktur dan tidak terstruktur supaya agen dapat mendasarkan responsnya kepada fakta semasa, bukan sekadar data latihan yang dimilikinya. Ingatan Agen menyediakan penyimpanan jangka pendek dan jangka panjang, bermakna agen boleh mengingat apa yang berlaku dalam sesi sebelumnya, memantau perubahan keutamaan pengguna, atau mengekalkan keadaan sepanjang alur kerja berbilang langkah. Lapisan Integrasi Data, yang dipanggil RDI oleh Redis, bertindak sebagai pemuat data masa nyata yang mengekalkan maklumat asas tetap segar.
Mengapa ini penting untuk infrastruktur AI
Iris juga tiba bersama versi Redis berbasis Flex SSD baru, yang menunjukkan bahawa syarikat tersebut mempertimbangkan kecekapan kos bersamaan dengan prestasi. Menjalankan semua dalam ingatan adalah pantas tetapi mahal. Tahap SSD boleh menjadikannya mungkin bagi enterpise untuk mengekalkan tetingkap konteks yang lebih besar dan ingatan agen yang lebih panjang tanpa meledakkan bajet infrastruktur mereka.

