速習 強化学習―基礎理論とアルゴリズム

個数:

速習 強化学習―基礎理論とアルゴリズム

  • ウェブストアに2冊在庫がございます。(2024年04月19日 17時28分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 145p/高さ 24cm
  • 商品コード 9784320124226
  • NDC分類 007.1
  • Cコード C3041

出版社内容情報

強化学習を学ぶ上での数学的前提の解説から、基礎理論とその代表的かつ新たなアルゴリズムまでを簡潔に自己完結した記述で解説。

目次

第1章 マルコフ決定過程
第2章 価値推定問題
第3章 制御
第4章 さらなる勉強のために
付録A 割引マルコフ決定過程の理論
付録B TD(λ)法の前方観測的な見方と後方観測的な見方について
付録C 深層強化学習を含む最近の発展

著者等紹介

小山田創哲[コヤマダソウテツ]
株式会社リクルートホールディングス

前田新一[マエダシンイチ]
株式会社Preferred Networks、博士(理学)

小山雅典[コヤママサノリ]
立命館大学理工学部数理科学科助教、博士(数学)(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

yorip

0
式が載ってるんだけど、変数の説明がなくて結局なんなのかわからないところがある2018/08/13

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/12276595
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。