出版社内容情報
強化学習を学ぶ上での数学的前提の解説から、基礎理論とその代表的かつ新たなアルゴリズムまでを簡潔に自己完結した記述で解説。
目次
第1章 マルコフ決定過程
第2章 価値推定問題
第3章 制御
第4章 さらなる勉強のために
付録A 割引マルコフ決定過程の理論
付録B TD(λ)法の前方観測的な見方と後方観測的な見方について
付録C 深層強化学習を含む最近の発展
著者等紹介
小山田創哲[コヤマダソウテツ]
株式会社リクルートホールディングス
前田新一[マエダシンイチ]
株式会社Preferred Networks、博士(理学)
小山雅典[コヤママサノリ]
立命館大学理工学部数理科学科助教、博士(数学)(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。