これまで取り組んできたRLフレームワークを、他の要素と組み合わせて、相乗効果があり、テストしやすくなった。よりエージェントに近い形になったが、準備ができ次第、主にそれを使って学習を進める予定。多くの部分にバグがある。 https://t.co/u2UzG89MIp まだ非常に作業中だが、3つのリポジトリを約3〜4時間で1つ(自分のもの)にリファクタリングできた。UIは大幅に改善された。
Coleこれまで取り組んできたRLフレームワークを、他の要素と組み合わせて、相乗効果があり、テストしやすくなった。よりエージェントに近い形になったが、準備ができ次第、主にそれを使って学習を進める予定。多くの部分にバグがある。 https://t.co/u2UzG89MIp まだ非常に作業中だが、3つのリポジトリを約3〜4時間で1つ(自分のもの)にリファクタリングできた。UIは大幅に改善された。