Результати торгівлі з використанням ШІ у реальних ринкових тестах були різними

iconMetaEra
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Недавнє дослідження MetaEra протестувало шість основних моделей ШІ на реальних фінансових ринках, включаючи США, акції A-класу та криптоактиви. MiniMax-M2 та DeepSeek-v3.1 показали кращі результати на певних ринках, але більшість моделей мали низький дохід і слабкий контроль ризиків. Результати свідчать, що ШІ все ще стикається з викликами у торгівельній діяльності та ефективному управлінні ризиками.
Штучний інтелект знає дуже багато, але зараз «не можна на нього покладатися».

Автор статті, джерело: Ян Ся, Магазин усіх справ Ян Ся

Останнім часом я не займався дослідженням та підготовкою інструменту Agent Trading?

Пройшовши через багато методів, інструментів і платформ для AI-трейдингу, витративши сотні мільйонів токенів,

Одне головне відчуття,

Штучний інтелект знає дуже багато, але зараз «не можна на нього покладатися».

Я знаю, що багато людей під час попередньої хвилі лобстерів розширили свої фінансові навички,

Захоплено готуйтесь до ринку, щоб здобути перемогу,

Звук поступово приглушився, раки виписані, вже по 14 юанів за кілограм.

Як побудувати надійний, виконуваний та ітеративний торгівельний агент на реальних ринках капіталу

За останні місяці я натрапив на стільки помилок, що можу написати 100 тисяч слів власного досвіду.

Проте сьогодні ми тимчасово залишимо це без уваги.

Останнім часом під час створення знань про архітектуру AT я натрапив на статтю, яка варта того, щоб поділитися нею з вами,

Особливо всі занурені в райський сад AI-трейдингу — видно неозброєним оком, що майбутнє буде повністю залежати від AI у інвестуванні.

Автори цієї статті «AI-TRADER: BENCHMARKING AUTONOMOUS AGENTS IN REAL-TIME FINANCIAL MARKETS» запропонували фреймворк AI-Trader, метою якого є оцінка ефективності фінансових рішень основних моделей LLM у повністю автономній, реальному часі та чистій середовищі даних.

Просто перевіряємо, наскільки добре штучний інтелект веде торгівлю на акціях.

Експеримент проводився з використанням трьох наборів активів: акції, що входять до NASDAQ-100 США, акції, що входять до Shanghai SE 50 Китаю, та 10 найпопулярніших криптовалют. Підтримується торгівля з частотою на годину (для акцій США) та на день (для акцій Китаю та криптовалют).

Різні моделі ШІ, запаковані в один і той самий агент, використовують MCP для отримання новин, інформації, фінансових звітів та ринкових даних, щоб автономно виконувати вилучення емоцій, числові розрахунки та відправлення торгівельних команд.

6 учасників (на той час DS-V4 ще не був випущений),

• DeepSeek-v3.1

• MiniMax-M2

• Claude-3.7-Sonnet

• GPT-5

• Qwen3-Max

• Gemini-2.5-Flash

З 25 листопада по 7 листопада, реальний ринок розпочався, отримані результати,

MiniMax-M2 посів перше місце на ринку США (у годинному діапазоні) та на китайському ринку A (у добовому діапазоні)

DS-V3.1 зайняв перше місце в криптовалютній групі.

Проте жорстоким є те, що

Більшість моделей погано виявляють себе на реальних ринках, маючи низький дохід і слабкий ризик-менеджмент.

Ці недоліки не можна виявити в оцінках на основі великих моделей.

Та сама модель, на різних ринках має зовсім інший стиль,

Наприклад, чемпіон MINIMAX прагне до прибутку на ринку США, а на ринку АКС переходить на оборону (низька волатильність, низький відкат), що свідчить про глибоке розуміння відмінностей між цими двома ринками у навчальних даних.

На американських ринках кілька моделей можуть перевершити QQQ,

У китайському ринку акцій жодна не перевершила Shanghai 50 — навіть якби прийшов Беркет, навіть найпотужніший ІІ прийшов, у моєму великому A, все одно доведеться кланятися.

Навіть DeepSeek, з коріннями та квантовою кров'ю,

Навіть якщо американські акції та криптовалютний ринок показують хороші результати, на ринку A це не допоможе.

Американський Gemini у середньому торгувався на 3,79 на американському ринку, а на китайському ринку його ціна стрімко зросла до 4,74 — ну, як кажуть, за море — звичаї не свій.

Усередині є кілька успішних випадків,

Наприклад, 10 жовтня DS за допомогою інструменту Search отримав новини про Трампа щодо «введення додаткових пошлин на Китай», висновуючи, що ризик для технологічних акцій високий, і виконав захисну стратегію:

Позиції у технологічних акціях зменшено з 99% до 70%

Додайте продукти першої необхідності (PEP) та комунальні послуги (AEP)

Зберігайте 17,3% готівки

Успішне зменшення втрат, краща продуктивність, ніж у більшості моделей

Так само DS зробив помилку, яку роблять усі штучні інтелекти на світі,

Потрапив під вплив одного джерела,

Отримано новину про «структурний повільний бик» без підтвердження через перехресну перевірку

Помилкове додавання позицій у традиційні енергетичні та банківські акції, пропущений головний ріст ринку

Виявлено недоліки агента у перевірці інформації та динамічній корекції

У добрих умовах інтерфейсу інформації та збігу даних ШІ не допускає «галюцинацій» у загальному сенсі,

Справжній «практичний дефіцит» полягає в тому, що

або неправильний аналіз (хибна інформація)

або частіше торгувати (неефективні угоди),

Або ризик-менеджмент не вдалося (попався на бомбі).

Це також кілька природних недоліків, які я особисто відчував у своїх експериментах з ШІ протягом останніх кількох місяців,

Проте ці проблеми мають рішення.

Кілька авторів у оригіналі,

Також було створено веб-сайт, призначений для відстеження та розвитку подальших експериментів з людино-машинною співпрацею у торгівлі,

Також можна прямо встановити їхні готові навички й взяти участь у торгівельному змаганні.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.