2019-11-28から1日間の記事一覧

Q-learning（Ｑ学習）による倒立振子 (棒を立て続ける)

gymの倒立振子を使って強化学習Q-learning（Ｑ学習）第１回 500試行ほどの学習によりかなり安定して棒を支えられるようになりました。プログラムのコードは CartPoleでQ学習（Q-learning）を実装・解説【Phythonで強化学習：第1回】こちらからそのまま使わ…