目次
第1章 強化学習とは
第2章 強化学習の基本的な問題設定
第3章 基本的な学習アルゴリズム
第4章 方策勾配法の発展
第5章 モデルベース強化学習
第6章 報酬設計の課題と対策
第7章 今後の展望
著者等紹介
小林泰介[コバヤシタイスケ]
2016年9月に名古屋大学大学院を短縮修了。博士(工学)取得。2016年11月から2022年3月まで奈良先端大学院大学助教。2022年4月から現在まで国立情報学研究所/総合研究大学院大学助教。その他に、2016年4月から10月まで日本学術振興会特別研究員、2018年5月から2019年3月までミュンヘン工科大学滞在研究員、2020年12月から2022年3月までJSTさきがけ研究者として従事。専門はヒューマノイドロボットを始めとする複雑なロボットの運動制御と、ロボット応用に向けた機械学習理論の開発(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
-
- 和書
- オクシアーナへの道