マルコフ決定過程―モデル化の基礎と応用事例

個数:
電子版価格
¥4,620
  • 電書あり

マルコフ決定過程―モデル化の基礎と応用事例

  • ウェブストアに2冊在庫がございます。(2024年04月24日 18時34分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 245p/高さ 23cm
  • 商品コード 9784627855212
  • NDC分類 417.1
  • Cコード C3004

内容説明

MDPでモデル化するための地力を養う。強化学習・深層強化学習のしくみの理解にも役に立つ。アルゴリズムの徹底詳説×豊富な応用事例。

目次

マルコフ決定過程とは
マルコフ決定過程の基本的な問題設定とアルゴリズム
マルコフ決定過程の基本的な機械学習
真のパラメータが変化するマルコフ決定過程
状態、行動、利得に関する工夫
推薦システムへの適用―基本的な非割引問題
金融工学への適用―基本的な割引問題
ロールプレイングゲームへの適用―複数の情報で構成される状態+複数の独立な試行で構成される状態遷移確率によるモデル
通信工学への適用―複数の情報で構成される状態+少数のパラメータで構成される状態遷移確率によるモデル
ベイズ流の仮説検定への適用―最後の期においてのみ利得が発生するモデル(基礎)
教育工学への適用―最後の期においてのみ利得が発生するモデル(発展)
設備保全、アセットマネジメントとヘルスケア支援への適用―良好な状態維持が目的のモデル
深層強化学習の入口
付録A マルコフ連鎖
付録B 隠れマルコフモデル
付録C ベイズ統計と統計的決定理論

著者等紹介

前田康成[マエダヤスナリ]
1997年早稲田大学理工学研究科修士課程機械工学専攻修了。1997年日本電信電話株式会社入社。1997年同社情報通信研究所勤務。1999年同社サイバースペース研究所勤務。2000年東日本電信電話株式会社研究開発センタ勤務。2004年博士(工学)(早稲田大学)。2005年北見工業大学助手。2007年北見工業大学助教。2010年北見工業大学准教授。2016年北見工業大学教授(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。