内容説明
推薦システム,金融工学,RPG,…そして,深層強化学習。
さまざまな応用例を交えながら,マルコフ決定過程の理論とモデル化の基礎が身につく一冊。
マルコフ決定過程は,マルコフ連鎖に制御や意思決定の要素を加えた確率モデルです。本書では,前半で基礎理論とアルゴリズムを,後半で応用事例を学んでいきます。モデル式の工夫のしかたや複雑な計算手順を,モデル化の観点から一貫性をもって理解することができます。
マルコフ決定過程は,深層強化学習のアルゴリズムの基礎でもあります。本書の最終章では,深層強化学習の概要とニューラルネットワークで行われる計算のしくみを,マルコフ決定過程の計算を通して学びます。
目次
第1章 マルコフ決定過程とは
第2章 マルコフ決定過程の基本的な問題設定とアルゴリズム
第3章 マルコフ決定過程の基本的な機械学習
第4章 真のパラメータが変化するマルコフ決定過程
第5章 状態,行動,利得に関する工夫
第6章 推薦システムへの適用
第7章 金融工学への適用
第8章 ロールプレイングゲームへの適用
第9章 通信工学への適用
第10章 ベイズ流の仮説検定への適用
第11章 教育工学への適用
第12章 設備保全,アセットマネジメントとヘルスケア支援への適用
第13章 深層強化学習の入口