LangChain, AI Ajanları için Otomatik QC Ekliyor ve Görev Tamamlamasını Sağlıyor

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
LangChain, MetaEra ile iş birliği yaparak Deep Agents serisi için RubricMiddleware’i tanıttı. Bu araç, AI agenterinin çıktılarını kod testi veya rapor tamamlılığı gibi önceden tanımlanmış kriterlere göre otomatik olarak kontrol etmesini sağlıyor. Çıktılar başarısız olursa, görev yineleme sınırına ulaşana kadar revize ediliyor. Sistem, biçimlendirme ve içerik kalitesinin kritik olduğu uzun görevler için tasarlandı. Yeni token listelemeleri ve bu tür AI ilerlemeleri, geliştiricileri ve traderleri çekiyor. LangChain, aracın kod testi veya alıntı denetimi gibi net standartlara sahip görevler için en uygun olduğunu söylüyor ve AI’nın sadece konuşma dışında daha güvenilir hale gelmesini sağlıyor.
ME AI Haberi, Dynamic Monitoring tarafından izlendiğine göre, LangChain, AI Agent'ların kendi çıktılarını önceden tanımlanmış kriterlere göre kontrol etmesini ve düzenlemesini sağlayan yeni bileşen RubricMiddleware'ı duyurdu. Geliştiriciler, görevin "tamamlanma kriterlerini" açıkça yazabilirler; örneğin, kodun testleri geçmesi, raporun belirli bölümleri kapsaması veya yasaklı içeriklerin yer almaması gibi. Agent, her sonuç teslim etmeye hazırlanırken, sistem bir değerlendirme modelini çağırarak her bir kriteri tek tek kontrol eder; herhangi bir kriter karşılanmazsa, geri bildirim orijinal Agent'a gönderilir ve kontrolü geçene veya yineleme sınırına ulaşana kadar düzeltmeler yapmaya devam eder. Bu mekanizma, Agent'ların uzun görevlerde sıkça karşılaştığı "son adımı kaçırmak" sorununu çözer. Çoğu Agent tamamen yapamıyor değil, sadece format, test, atıf, bölüm gibi zorunlu gereksinimleri kolayca atlıyor. RubricMiddleware, görev zincirine otomatik bir kalite kontrolcü ekliyor ve Agent'ın sadece benzer görünüşlü bir cevap üretmekle kalmayıp, neyin gerçekten tamamlandığını anlamasını sağlıyor. LangChain belgeleri de açıkça belirtiyor ki, bu yöntem, haikuda hece sayısının doğru olup olmadığı, kod yeniden yapılandırıldıktan sonra testlerin geçip geçmediği veya raporun tüm gerekli bölümlerini içerip içermediği gibi net kabul kriterlerine sahip görevler için en uygundur. Normal kullanıcılar için bu özelliğin değeri, Agent'ın daha iyi sohbet etmesini sağlamaktan ziyade, bir kontrol listesine göre görevleri tamamlayabilen bir yürütücü gibi davranmasını sağlamaktadır. (Kaynak: MLion)
Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.