source avatarvalo

分享

這是一個老派《Runescape》的強化學習代理,對抗一個完全不公平的對手——一個總是做出「正確決定」、且在你行動前 50% 時間就能讀懂你意圖的完美機器人。誰是誰很容易分辨。 對於熟悉這款遊戲的人來說,這可能有點令人驚訝,但這個策略代理完全碾壓了對手。尤其是當你觀察它的玩法時,它總是裝備著與其目標完全不匹配的「垃圾」裝備,幾乎從不做任何頂尖人類玩家會做的動作。 它僅需在單一張 4090 顯卡上訓練幾分鐘,勝率就能輕鬆達到 90%。當然,真正的考驗在於它能否對抗最頂尖的人類玩家,但即使我這裡有真人對戰模式,我也無法測試,因為我一開始就被這個策略代理徹底擊潰了。我以前可是這方面的高手。 「直接讓它和真實玩家在遊戲中對戰」是其中一個考慮方向,但我們並不太想直接作弊。不過,如果能設置一個私密環境就太棒了!

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露