Nakakapag-isa ang Performans ng AI sa Mga Totoong Pagsubok ng Merkado

iconMetaEra
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Isang kamakailang pag-aaral ng MetaEra ay sinubukan ang anim na pangunahing AI model sa totoong mga pamilihan ng pananalapi, kabilang ang US, A-shares, at mga crypto asset. Nakapagpakita ang MiniMax-M2 at DeepSeek-v3.1 ng mas magagandang resulta sa ilang mga pamilihan, ngunit ang karamihan sa mga model ay may mababang kita at mahinang kontrol sa panganib. Ipapakita ng mga natuklasan na ang AI ay patuloy na nakakaranas ng mga hamon sa pagtrabaho sa pagtinda at epektibong pagpapahalaga sa panganib.
Nakakaalam ang AI ng marami, ngunit kasalukuyang 'hindi maaasahan'.

May-akda at pinagkunan: Yang Xia, Yang Xia’s万事屋

Sa mga nakalipas na araw, hindi ako nag-aaral at naghahanda ng Agent Trading tool?

Pagkatapos subukan ang maraming AI trading methods, tools, at platforms, at nasayang ang milyon-milyon na token,

Isang pangunahing pakiramdam,

Nakakaalam ang AI ng marami, ngunit kasalukuyang 'hindi maaasahan'.

Alam kong marami ang naglagay ng iba't ibang financial skills sa sarili nila noong unang panahon ng lobster mania.

Excited na maghanda para mag-sabog sa merkado,

Ang boses ay naging mas mahina, ang lobster ay na-cancel, naging ₱14 na ang bawat kilo.

Paano bumuo ng isang trading agent na may katiyakan, mapagkakatiwalaan, at maaaring i-iterate sa tunay na merkado ng kapital,

Mga pagkakamali sa nakalipas na ilang buwan, maaari kong isulat ang 100,000 salitang personal na karanasan,

Ngunit sa araw na ito, paunang itigil natin ito.

Kanina lang habang binubuo ang kaalaman sa AT architecture, nakakita ako ng isang papel na lubos na值得 ibahagi sa inyong lahat,

Lalo na’t lahat ay nakalulutang sa paraisong nawala sa AI trading, malinaw na nakikita na ang hinaharap ay may ganap na pakikilahok ang AI sa pag-invest.

Ang mga may-akda ng papeles na “AI-TRADER: BENCHMARKING AUTONOMOUS AGENTS IN REAL-TIME FINANCIAL MARKETS” ay nagtataguyod ng AI-Trader framework na may layuning suriin ang epekto ng mga pangunahing LLM model sa paggawa ng desisyon sa pananalapi sa isang ganap na awtonomiko, real-time, at walang kontaminasyon na kapaligiran.

Sa madaling salita, subukin kung gaano kabisado ang AI sa pagtrading ng stocks.

Ang eksperimento ay ginawa sa mga bahagi ng Nasdaq-100 ng US stock market, mga bahagi ng Shanghai SSE 50 ng China stock market, at 10 pangunahing cryptocurrency, na may suporta sa trading frequency na oras-oras (US stock market) at araw-araw (China stock market at cryptocurrency).

Mga iba’t ibang AI model, nakapalibot sa iisang Agent, gumagamit ng MCP upang makakuha ng balita, impormasyon, financial reports, at data ng presyo, at kayang magawa nang sarili ang pagkuha ng emosyon, pagkalkula ng mga数值, at pagpapadala ng mga order ng pagtinda.

6 na mga kalahok (noong hindi pa ipinakilala ang DS-V4),

• DeepSeek-v3.1

• MiniMax-M2

• Claude-3.7-Sonnet

• GPT-5

• Qwen3-Max

• Gemini-2.5-Flash

Mula sa Nobyembre 25 hanggang Nobyembre 7, aktibong ipinaglaban ang merkado, ang resulta ng pagpapatakbo,

MiniMax-M2, nanalo sa dalawang championship: US Stocks (hourly) at A-Stocks (daily)

Ang DS-V3.1 ay nakuha ang unang pwesto sa grupo ng cryptocurrency.

Gayunpaman, ang katotohanan ay malupit,

Ang karamihan sa mga modelo ay nagtatampok ng mahirap na pagganap sa totoong merkado, mababang kita at mahinang pagsasagawa ng panganib.

Hindi maipapakita ang mga kakulangan na ito sa mga pangunahing pagsubok ng mga modelo.

Ang parehong modelo, sa iba’t ibang merkado, may malaking pagbabago sa estilo,

Halimbawa, ang champion na MINIMAX, ay naglalayon ng kita sa US market, at nagpapalit sa pagiging defensive sa A market (mababang volatility, mababang drawdown), na nagpapakita na ang training data ay may malinaw na pag-unawa sa pagkakaiba ng dalawang merkado.

Sa US stocks, maraming model ang kayang labanan ang QQQ,

Sa A-share market, walang nakalabas sa upang50; kahit si Buffett ang dumating, kahit ang pinakamalakas na AI ang dumating, sa aking malaking A, kailangan pa rin ninyong huminga.

Kahit ang DeepSeek na may-akda ng linya at quant血脉,

Kahit maganda ang performance sa US stock at crypto markets, hindi rin ito makakagawa ng magandang resulta sa A-share market.

Ang Gemini sa Amerika, na may average na pagtrabaho sa US stock market na 3.79, ay naging pambobola sa A-share hanggang sa 4.74—ano bang sabihin nito? Sumasayaw sa kultura ng lugar.

May ilang mga kaso ng tagumpay dito,

Halimbawa, noong Oktubre 10, gamit ang Search tool, natanggap ni DS ang balita tungkol sa Trump tungkol sa “pagpapataas ng taripa laban sa Tsina,” at nilikha niya ang pagkakaroon ng mataas na panganib sa tech stocks, kaya isinagawa niya ang defensive strategy:

Ang posisyon sa tech stocks ay bumaba mula sa 99% patungo sa 70%

Dagdagan ang mga pangunahing pangangailangan sa pagkain (PEP) at mga utility (AEP)

Panatiliin ang 17.3% na pera

Nabawasan ang pagkawala nang matagumpay, mas mabuting pagganap kaysa sa karamihan sa mga modelo

Gayundin, nagkamali din ang DS sa isang pagkakamali na ginagawa ng lahat ng AI sa mundo,

Nakakatanga sa isang solong pinagkukunan

Nakatanggap ng balita tungkol sa “structural bull market” ngunit hindi nag-verify ng cross-check

Mali ang pagdagdag ng posisyon sa tradisyonal na enerhiya at mga barya ng bangko, at nawala ang pangunahing pagtaas ng merkado

Napapakita ng mga kahinaan ng agent sa pag-verify ng impormasyon at dinamikong pagkorekta

Sa mga kondisyon ng maayos na interface ng impormasyon at pagkakasunod-sunod ng data, hindi nagkakaroon ng karaniwang pagkakamali na "halusinasyon" ang AI,

Ang totoong "praktikal na kakulangan" ay nasa,

O kaya ay maling pagsusuri (maling impormasyon),

Oman ay madalas na magtrabaho (hindi epektibong transaksyon),

O kaya'y nabigo ang risk management (nabasag).

Ito rin ay ilang likas na kakulangan na aking nadama sa mga eksperimento sa AI sa nakalipas na ilang buwan,

Subalit, may solusyon para sa mga problema na ito.

Ang ilang may-akda sa orihinal na teksto,

Isinagawa rin nila ang isang website na espesyal na ginagamit para subaybayan at pagbutihin ang mga susunod na eksperimento sa pagtutulungan ng tao at makina sa pagtinda,

Maaari mo pa ring direktang i-install ang kanilang pre-built skill para maglaro ng trading competition.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.