今日はデータサイエンスネタです。
強化学習って、機械学習の中でも
一番異質に感じ、理解が浅かった。
教師あり/なし学習とは別概念。
エージェント、環境、報酬・・?
と、構成要素から、独特なんですよね。
それでいて、alpha-Goとか、
囲碁、将棋のAIは今大抵強化学習ベース。
AI最前線では、避けて通れない手法です。
E資格でも、出題はありますね。
で、満を持して登場したのが、
「ゼロから作る」シリーズの強化学習編!
今月(2022年4月)発売したばかりです。
リンク
式をなんとなく覚えては、
頭から消えていた「ベルマン方程式」。
導出の過程や式変形、
ミニマムな具体例による説明が
分かりやすすぎる。
ゼロから作るシリーズは、
ディープラーニング編でも、
あらゆるディープラーニング本より
分かりやすかったですからね。
逆伝播の意味とか。
頭から消えていた「ベルマン方程式」。
導出の過程や式変形、
ミニマムな具体例による説明が
分かりやすすぎる。
ゼロから作るシリーズは、
ディープラーニング編でも、
あらゆるディープラーニング本より
分かりやすかったですからね。
逆伝播の意味とか。
中途半端だった理解が、
今になってつながってくるのは、
楽しいですね。
今になってつながってくるのは、
楽しいですね。