Este é um agente RL antigo do Runescape enfrentando um oponente completamente injusto: um robô perfeito que sempre toma a “decisão correta” e lê suas ações antes de elas acontecerem 50% das vezes. É fácil distinguir qual é qual. Para pessoas que conhecem algo sobre este jogo, pode ser um pouco surpreendente, mas a política esmaga o oponente. Especialmente se você observar como ela joga. Ela equipa constantemente itens supostamente ruins para o que está tentando fazer e quase nunca realiza qualquer ação que um jogador humano de alto nível gostaria de fazer. Ela atinge facilmente taxas de vitória de 90% em poucos minutos de treinamento em um único 4090. Claro, o verdadeiro teste seria como ela generaliza contra os melhores jogadores humanos absolutos, mas mesmo tendo um modo humano aqui, é impossível para mim testar, pois sou completamente derrotado pela política imediatamente. Eu também já fui muito bom nisso. “Só coloque-a contra jogadores reais no jogo ao vivo” é uma consideração, mas não estamos muito interessados em fraudar diretamente o jogo; seria muito legal conseguir algo privado configurado!
valoCompartilhar
Fonte:Mostrar original
Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações.
Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.
