Start_python’s diary
gymの倒立振子を使って強化学習Q-learning(Q学習)第1回 500試行ほどの学習によりかなり安定して棒を支えられるようになりました。 プログラムのコードは CartPoleでQ学習(Q-learning)を実装・解説【Phythonで強化学習:第1回】 こちらからそのまま使わ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。