強化学習アルゴリズム入門―「平均」からはじめる基礎と応用

個数:
電子版価格
¥3,300
  • 電子版あり
  • ポイントキャンペーン

強化学習アルゴリズム入門―「平均」からはじめる基礎と応用

  • 曽我部 東馬【著】
  • 価格 ¥3,300(本体¥3,000)
  • オーム社(2019/05発売)
  • ゴールデンウィーク ポイント2倍キャンペーン対象商品(5/6まで)
  • ポイント 60pt
  • 在庫が僅少です。通常、3~7日後に出荷されます
    ※事情により出荷が遅れたり、在庫切れとなる場合もございます。
    ※他のご注文品がすべて揃ってからの発送が原則となります(ご予約品を除く)。
    ※複数冊ご注文はお受けできません。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【出荷予定日】
    ■通常、3~7日後に出荷されます

    【ご注意事項】 ※必ずお読みください
    ◆在庫状況は刻々と変化しており、ご注文手続き中やご注文後に在庫切れとなることがございます。
    ◆出荷予定日は確定ではなく、表示よりも出荷が遅れる場合が一部にございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 202p/高さ 21cm
  • 商品コード 9784274223716
  • NDC分類 007.1
  • Cコード C3055

出版社内容情報

「平均」の観点から強化学習の原理がわかる!
AlphaGoがプロ棋士を破った2016年以降、さまざまな分野から注目されている深層強化学習ですが、専門書は非常に難解でわかりづらい傾向にあります。
そこで本書は、初歩的な数学を使って原理をわかりやすく解説します。価値・探索・マルコフ決定過程・動的計画法・モンテカルロ法・TD法といった強化学習の諸要素を、中高生にもなじみ深い平均値の計算から説明し、初学者でも基本とコツを自然と身につけられます。抽象的な強化学習の概念と煩雑な数学式を直感的に感じつつ、本質まで把握できることが本書の最大の特徴です。
また、すべての例題にPythonとMATLABのコードを示し、原理・数式・コードという一連の流れを紐付けて理解できるようになっています。初学者でも入りやすく、難しさを感じないまま、強化学習の基本と深層学習のコツを自然と身につけられる入門書です。

【本書の特徴】
・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説しています。
・すべての例題にPythonとMATLABのコードを例示しています。

内容説明

強化学習の難解な理論を平均を入口としてやさしく解説。原理→数式→プログラムの流れで全体像を直感的に把握できます。

目次

第1章 平均で学ぶ強化学習の基本概念(平均と期待値;平均と価値 ほか)
第2章 各アルゴリズムの特徴と応用(強化学習における方策π(a|S)
動的計画法 ほか)
第3章 関数近似手法(関数近似の基本概念;関数近似モデルを用いたV(St)の表現 ほか)
第4章 深層強化学習の原理と手法(TD‐Q学習法におけるNNによる行動価値関数の回帰;DQNによる行動状態価値関数の近似 ほか)

著者等紹介

曽我部東馬[ソガベトウマ]
理学博士(物理学専攻)。マックス・プランク研究所(独)博士研究員、ケンブリッジ大学(英)研究員を経て、2009年帰国、株式会社グリッドの設立に携わり、取締役最高技術責任者を務める。2011年より東京大学先端科学技術研究センター特任助教、特任准教授を歴任、2016年3月電気通信大学准教授、株式会社グリッド最高技術顧問(兼務)、東京大学先端科学技術研究センター客員研究員(兼務)(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

kaida6213

5
他の強化学習本が難しすぎたので入門編として購入。平易な言葉で分かりやすく説明してくれる。特に方策型/価値型の違いや、SARSA/Q学習の違い、関数近似の必要性など非常にわかりやすかった。 一方で、例えが下手なのだろうか、ところどころ分かりにくい部分も多い。「当然~」という書き方も多いが、論理的必然性がない場合も多く、かえって読みにくい箇所もあった。シンプルに書いてくれれば非常にわかりやすかったのではないかと思う。 が、トータルすると入門書として良書だと思う。2021/10/02

ゆう

0
論理の繋がりが不明確な文章が多く非常にわかりづらい。2024/01/24

さぼん

0
各モデルのプロセスがこれでもかとわかりやすく示されている点でとても貴重な強化学習の教科書だと感じる。2023/01/01

おしるこ

0
主要な概念をわかりやすく、手計算レベルで解説してくれる本。最後の最後以外はめちゃくちゃ丁寧でわかりやすい。深層学習の知識だけは別途理解する必要がある。 何回も読みたい。2019/07/17

おしるこ

0
主要な概念をわかりやすく、手計算レベルで解説してくれる本。最後の最後以外はめちゃくちゃ丁寧でわかりやすい。深層学習の知識だけは別途理解する必要がある。 何回も読みたい。2019/07/17

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/13768745
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。

最近チェックした商品