内容説明
※本商品は固定レイアウトのコンテンツです。文字列のハイライトや検索、辞書の参照引用などの機能はご利用になれません。あらかじめご了承ください。
本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPython を用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記述し、読者の学びやすさを優先して繰り返しの説明や既出の数式を再掲するなど工夫している。Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。
目次
第1章 Pythonで強化学習を行うための環境構築
第2章 Pythonの基礎
第3章 強化学習の概要
第4章 マルコフ決定過程
第5章 動的計画
第6章 モンテカルロ学習
第7章 Temporal Difference学習



