Web3徒然ブログ

Web3という大きな波に会社員エンジニアはどう対峙すべきか。クリプト、NFT、DeFi、メタバース…多様な情報に触れ思考したことを発信します。どこにでもいる会社員だからこその、日々の気づき、ビジネスTipsも発信します。

【E資格対策にも】分かりやすすぎる強化学習本~ゼロから作るシリーズ~

今日はデータサイエンスネタです。

強化学習って、機械学習の中でも
一番異質に感じ、理解が浅かった。

 

教師あり/なし学習とは別概念。
エージェント、環境、報酬・・?
と、構成要素から、独特なんですよね。

 

それでいて、alpha-Goとか、
囲碁、将棋のAIは今大抵強化学習ベース。
AI最前線では、避けて通れない手法です。

 

E資格でも、出題はありますね。

 

で、満を持して登場したのが、
「ゼロから作る」シリーズの強化学習編!
今月(2022年4月)発売したばかりです。

 

 
式をなんとなく覚えては、
頭から消えていた「ベルマン方程式」。
導出の過程や式変形、
ミニマムな具体例による説明が
分かりやすすぎる。

ゼロから作るシリーズは、
ディープラーニング編でも、
あらゆるディープラーニング本より
分かりやすかったですからね。
逆伝播の意味とか。
 
中途半端だった理解が、
今になってつながってくるのは、
楽しいですね。