ИИ знает очень много, но пока «ненадежен».
Автор статьи, источник: Ян Ся, Магазин всех дел Ян Ся
В последнее время я занимался исследованием и подготовкой инструмента Agent Trading,
Пробовав множество методов, инструментов и платформ для AI-трейдинга, потратив сотни миллионов токенов,
Одно ключевое ощущение,
ИИ знает очень много, но пока «ненадежен».

Я знаю, что многие во время предыдущего ажиотажа с раками нарастили себе различные финансовые навыки,
С нетерпением готовитесь выйти на рынок и показать себе все возможности,
Звук постепенно затих, лобстеры были аннулированы, теперь по 14 юаней за фунт.
Как построить надежный, исполняемый и итеративный торговый агент на реальных финансовых рынках
За последние несколько месяцев я наткнулся на столько ловушек, что могу написать сто тысяч слов личного опыта,
Однако сегодня давайте пока отложим это.
При изучении знаний об архитектуре AT недавно наткнулся на статью, которая стоит того, чтобы поделиться ею с вами,
Особенно все погружены в райскую иллюзию AI-трейдинга — очевидно, что будущее — это полное участие ИИ в инвестициях.

Авторы статьи «AI-TRADER: BENCHMARKING AUTONOMOUS AGENTS IN REAL-TIME FINANCIAL MARKETS» представили框架 AI-Trader, направленный на оценку эффективности принятия финансовых решений основными моделями LLM в полностью автономной, реального времени и чистой среде без загрязнения данных.
Проще говоря, это проверка эффективности ИИ в торговле акциями.
Эксперимент проводился на трех наборах активов: акции, входящие в состав NASDAQ-100 США, акции, входящие в состав Shanghai SSE 50 Китая, и 10 основных криптовалют. Поддерживаются торговые частоты по часам (для акций США) и по дням (для акций Китая и криптовалют).
Различные ИИ-модели, упакованные в один и тот же агент, используют MCP для получения новостей, информации, отчетов и рыночных данных, самостоятельно извлекая эмоциональные показатели, выполняя числовые расчеты и отправляя торговые команды.

6 участников (на тот момент DS-V4 еще не был выпущен),
• DeepSeek-v3.1
• MiniMax-M2
• Claude-3.7-Sonnet
• GPT-5
• Qwen3-Max
• Gemini-2.5-Flash
С 25 ноября по 7 ноября реальный рынок начался, и были получены результаты,
MiniMax-M2 завоевал два чемпионства: на американских акциях (почасовой уровень) и на китайских акциях (дневной уровень)
DS-V3.1 занял первое место в крипто-группе.

Однако жестоко то, что
Большинство моделей плохо показывают себя на реальных рынках, обеспечивая низкую прибыль и слабый риск-менеджмент.
Эти недостатки не могут быть выявлены в оценках по основным эталонным моделям.
Та же модель, на разных рынках ведет себя по-разному,
Например, чемпион MINIMAX стремится к доходности на американском рынке акций, а на китайском рынке переходит на оборонительную стратегию (низкая волатильность, низкая просадка), что свидетельствует о хорошем понимании различий между этими двумя рынками в обучающих данных.
На американском фондовом рынке несколько моделей могут превзойти QQQ,
На рынке A ни одна акция не смогла обогнать SSE 50 — даже если бы пришел Берти Уоррен и самый мощный ИИ, в моем большом A все равно пришлось бы склониться.
Даже DeepSeek, родом из лаборатории и с квантовой кровью,
Хорошо выступать на американских фондовых и криптовалютных рынках — этого недостаточно для успеха на китайских акциях.
Американская Gemini в среднем торгуется по 3,79 на американском рынке, а на китайском рынке безумно подскочила до 4,74 — ну что ж, по местным обычаям.

Внутри есть несколько успешных кейсов,
Например, 10 октября DS с помощью инструмента Search получил новости о Трампе о «введении пошлин на Китай», сделал вывод о высоком риске для акций технологических компаний и применил защитную стратегию:
Позиции в акциях технологических компаний снижены с 99% до 70%
Добавить потребительские товары первой необходимости (PEP) и коммунальные услуги (AEP)
Сохранить 17,3% наличными
Успешное сокращение убытков, лучшая производительность по сравнению с большинством моделей
Также DS допустил ошибку, которую совершают все ИИ в мире,
Попался на одном источнике,
После получения новости о «структурном медвежьем рынке» не进行了交叉验证
Ошибка: покупка традиционных энергетических и банковских акций, пропуск основного ростового тренда рынка
Выявились недостатки агента в проверке информации и динамическом исправлении ошибок
При наличии хорошего интерфейса информации и согласованных данных ИИ не допускает ошибок «галлюцинаций» в общем смысле,
Настоящий «практический дефект» заключается в том,
либо неправильный анализ (ложная информация)
либо часто торговать (неэффективные сделки),
Или риск-менеджмент не сработал (попали на скам).
Это также несколько естественных недостатков, которые я лично ощутил в своих экспериментах с ИИ за последние месяцы,
Однако у всех этих проблем есть решения.
Несколько авторов в оригинальном тексте,
Также был создан веб-сайт, специально предназначенный для отслеживания и развития последующих экспериментов по сотрудничеству человека и машины в торговле,
Вы также можете сразу установить их готовый навык и участвовать в торговых соревнованиях.
