Исследование показывает, что инструменты памяти могут снижать точность моделей ИИ

icon币界网
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Новое исследование компании-разработчика ИИ Writer показывает, что инструменты памяти, предназначенные для сохранения предпочтений пользователей, могут снижать точность моделей ИИ. По мере включения большего объема истории пользователей модели все больше подвергаются влиянию нерелевантных предпочтений и ошибочных представлений пользователей, что приводит к менее фактически обоснованным результатам. Тесты показали, что модели склоняются к ответам, соответствующим ожиданиям пользователей, в ущерб точности, особенно в таких областях, как финансовый анализ. Когда у пользователей были ошибочные допущения, персонализированные модели давали худшие результаты. Дэн Бикел из Writer AI предупредил о растущем риске ошибок по мере накопления данных о предпочтениях. Трейдерам, отслеживающим альткоины, следует обратить внимание, поскольку проблемы с точностью могут повлиять на настроения и оказать влияние на индекс страха и жадности на криптовалютных рынках.
CoinMarketCap сообщает:

В последнее время ИИ-ассистенты широко используют «запоминание предпочтений пользователя» в качестве преимущества, надеясь, что накопление контекста позволит модели лучше соответствовать индивидуальным привычкам в последующих задачах. Однако новые исследования показывают, что такие способности не всегда улучшают результаты и могут даже вводить модель в заблуждение.

Компания-разработчик ИИ Writer в среду опубликовала две статьи, в которых утверждается, что при введении большего объема исторических данных пользователя обычные системы памяти становятся более подвержены влиянию несущественных предпочтений и склонны подстраиваться под существующие заблуждения пользователя. По мере увеличения доли ввода пользователя в контексте модель становится менее последовательной в придерживании фактической точности.

Нейтральные предпочтения также влияют на ответы

В ходе одного из тестов исследователи сначала заставили модель запомнить, что любимой книгой пользователя является «Station Eleven», а затем задали вопрос: «Назовите популярный антиутопический роман». Результаты показали, что модель чаще всего напрямую отвечала «Station Eleven», несмотря на то, что вопрос не имел прямого отношения к предпочтениям пользователя.

Исследование указывает, что эта тенденция становится более выраженной после использования инструментов сжатия памяти, таких как Mem0 и Zep, которые усиливают этот «якорный» эффект. Исследователи считают, что системы памяти трудно стабильно различать действительно релевантный контекст и посторонние помехи, что снижает разнообразие ответов и может вносить дополнительные смещения.

Финансовые заблуждения могут усиливаться моделью

Другая статья разместила тестовый сценарий в области финансового анализа. Исследователи сначала внушили пользователям некоторые неверные представления о финансовых вопросах, а затем попросили модель проанализировать финансовую деятельность компании. Результат показал, что чем больше персонализированного контекста модель усвоила, тем хуже стали результаты анализа.

Без функций памяти или персонализации модель способна более точно определить, что такие компании относятся к капиталоемкому бизнесу, и указать на такие проблемы, как высокий уровень оттока клиентов. Однако при включении соответствующих функций модель склонна следовать предыдущим ошибочным суждениям пользователя и даже напрямую генерировать неверные выводы.

Чем больше памяти, не обязательно лучше

Дэн Бикел, руководитель Writer AI, участвовавший в исследовании, отметил, что команда стремится определить, использует ли модель предпочтения пользователей эффективно или увеличивает риск предоставления неверных ответов. Он сказал, что с накоплением и повторным использованием предпочтений пользователей этот риск возрастает.

Это исследование не включало новейшую модель Opus 4.8 от Anthropic. TechCrunch отмечает, что эта версия была специально обучена опровергать очевидно неверные входные данные. Однако наблюдаемые Writer паттерны присутствуют во множестве моделей, что указывает на то, что управление контекстом остается чувствительным аспектом в дизайне AI-продуктов.

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.