Start_python’s diary

ふたり暮らし

アラフィフ夫婦のフリーランスプラン

強化学習の歴史/11月の振り返り

強化学習の歴史

強化学習の始まりは1763年「ベイズの定理」のベースが発表された年だと言われています。1989年「Q学習」が開発され強化学習の実用性がかなり上がりました。
その後「冬の時代」が続きますが、2006年「ディープラーニング」の概念が提案されました。そして2009年、ニューラルネットワークをわずか3週間ほどで十分に学習させられることを立証し、最先端の音声認識技術を確立させました。
それから10年、飛躍的に進化を続けています。

11月を振り返って

強化学習、楽しいです。やっとQ学習がわかってきて(計算式は相変わらず理解できませんが)1989年に追いついた感じです。勉強するにしたがって「ディープラーニング」のすごさが実感できました。どれくらい時間がかかるかわかりませんが一歩ずつこれからも勉強できればと思います。

 

 

参考サイト

doll.hatenadiary.com

gigazine.net

 

 

文責:Luke