Reinforcement Learning Foundations

個数:
  • 予約

Reinforcement Learning Foundations

  • 現在予約受付中です。出版後の入荷・発送となります。
    重要:表示されている発売日は予定となり、発売が延期、中止、生産限定品で商品確保ができないなどの理由により、ご注文をお取消しさせていただく場合がございます。予めご了承ください。

    ●3Dセキュア導入とクレジットカードによるお支払いについて
  • 【入荷遅延について】
    世界情勢の影響により、海外からお取り寄せとなる洋書・洋古書の入荷が、表示している標準的な納期よりも遅延する場合がございます。
    おそれいりますが、あらかじめご了承くださいますようお願い申し上げます。
  • ◆画像の表紙や帯等は実物とは異なる場合があります。
  • ◆ウェブストアでの洋書販売価格は、弊社店舗等での販売価格とは異なります。
    また、洋書販売価格は、ご注文確定時点での日本円価格となります。
    ご注文確定後に、同じ洋書の販売価格が変動しても、それは反映されません。
  • 製本 Hardcover:ハードカバー版/ページ数 350 p.
  • 言語 ENG
  • 商品コード 9781009711104

Full Description

Bridging the gap between introductory texts and the specialized research literature, this is one of the first truly rigorous yet accessible treatments of modern reinforcement learning. Written by three leading researchers with over a decade of teaching experience, the book uniquely combines mathematical precision with practical insights. It progresses naturally from planning (dynamic programming, MDPs, value and policy iteration) to learning (model-based and model-free algorithms, function approximation, policy gradients, and regret minimization). Each concept is developed from first principles with complete proofs, making the material self-contained. The modular chapter organization enables flexible course design. The book's website offers battle-tested exercises refined through years of classroom use. Combining mathematical rigor with practical applications, this definitive text is ideal for advanced undergraduate and graduate students as well as practitioners seeking a deep understanding of sequential decision-making and intelligent agent design.

Contents

1. Introduction and overview; 2. Preface to the planning chapters; 3. Deterministic decision processes; 4. Markov chains; 5. Markov decision processes and finite horizon dynamic programming; 6. Discounted Markov decision processes; 7. Episodic Markov decision processes; 8. Linear programming solutions; 9. Preface to the learning chapters; 10. Reinforcement learning: model based; 11. Reinforcement learning: model free; 12. Large state spaces: value function approximation; 13. Large state space: policy gradient methods; 14. Regret minimization; A. Dynamic programming; B. Ordinary differential equations; References; Index.

最近チェックした商品