【E資格対策にも】分かりやすすぎる強化学習本～ゼロから作るシリーズ～ - Web3時代のつよつよビジネスパーソンを目指すブログ

今日はデータサイエンスネタです。

強化学習って、機械学習の中でも
一番異質に感じ、理解が浅かった。

教師あり/なし学習とは別概念。
エージェント、環境、報酬・・？
と、構成要素から、独特なんですよね。

それでいて、alpha-Goとか、
囲碁、将棋のAIは今大抵強化学習ベース。
AI最前線では、避けて通れない手法です。

E資格でも、出題はありますね。

で、満を持して登場したのが、
「ゼロから作る」シリーズの強化学習編！
今月(2022年4月)発売したばかりです。

リンク

式をなんとなく覚えては、
頭から消えていた「ベルマン方程式」。
導出の過程や式変形、
ミニマムな具体例による説明が
分かりやすすぎる。

ゼロから作るシリーズは、
ディープラーニング編でも、
あらゆるディープラーニング本より
分かりやすかったですからね。
逆伝播の意味とか。

中途半端だった理解が、
今になってつながってくるのは、
楽しいですね。