AI & TECHNOLOGY<br> 現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御

個数:
電子版価格
¥3,740
  • 電子版あり
  • ポイントキャンペーン

AI & TECHNOLOGY
現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御

  • ウェブストアに1冊在庫がございます。(2025年07月20日 06時17分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 313p/高さ 22cm
  • 商品コード 9784798159928
  • NDC分類 007.1
  • Cコード C3055

出版社内容情報

注目の最新AI技術!深層強化学習の開発手法がわかる!

第一線で活躍する著者陣の書下ろしによる待望の1冊!



【本書の目的】

Alpha Go(アルファ碁)でも利用されている深層強化学習。

AIサービスのみならずロボティクス分野でもその応用が期待されています。

本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。



【本書の特徴】

第1部では、まず、深層強化学習の概要について説明します。

次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。

さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。

3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。


全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。



【読者が得られること】

深層強化学習による開発手法を学ぶことができます。


【対象読者】

深層強化学習を学びたい理工学生・エンジニア

内容説明

AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

目次

1 基礎編(強化学習の有用性;強化学習のアルゴリズム;深層学習による特徴抽出;深層強化学習の実装)
2 応用編(連続制御問題への応用;組合せ最適化への応用;系列データ生成への応用)
APPENDIX 開発環境の構築

著者等紹介

伊藤多一[イトウタイチ]
1995年名古屋大学大学院理学研究科博士課程修了。博士(理学)。2004年3月まで素粒子物理学の研究に従事。同年、受託データ分析を専業とするベンチャー企業に入社、数々のデータ分析案件に携わる。2013年よりブレインパッド社にて機械学習による広告効果分析などに携わる。2016年以降は深層学習による画像解析案件にも携わる

今津義充[イマズヨシミツ]
素粒子・原子核物理学の研究を通して統計分析・モデル構築、数値シミュレーションに精通。2013年よりブレインパッド社にて需要予測や数理最適化などの定量分析案件を主導。近年は深層学習技術を活用した分析案件や応用研究に従事。博士(理学)

須藤広大[スドウコウダイ]
1年間の世界放浪の後、奈良先端科学技術大学院大学で自然言語処理学を専攻。修士(情報工学)。新卒でブレインパッド社に入社し、機械学習エンジニアとして、深層学習に関連した分析・開発案件に携わる

仁ノ平将人[ニノヒラマサト]
大学院では経営システム工学を専攻し、2018年にデータサイエンティストとしてブレインパッド社に新卒入社。入社後は強化学習や自然言語処理を用いた案件に従事。修士(工学)

川崎悠介[カワサキユウスケ]
大学では情報工学を専攻し、2018年にブレインパッド社に入社。画像認識・時系列予測を用いた案件に携わる。修士(工学)

酒井裕企[サカイユウキ]
2018年、大学院では素粒子論を専攻し、学位取得後はデータサイエンティストとしてブレインパッド社に新卒入社、自社プロダクトにまつわるデータ分析案件に携わる。博士(理学)

魏崇哲[ウェイチョンチェア]
2011年、オークランド大学大学院機械工学科修士課程修了。修士(機械工学)。卒業後、Foxconnに入社、ロボットの研究開発に携わる。2018年にブレインパッド社に入社、深層学習と強化学習による画像分析とゲームAI開発案件に携わる(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

vinlandmbit

19
図書館本。深層強化学習において、基本と応用の両方を実践通して学べる良書だと感じました。2022/12/28

kaida6213

6
入門と冠しているが中々難しい内容。他の本で基礎を学んでから読んでみると、非常にコンパクトに情報がまとまっていて良書だと感じた。後半半分以上最近の事例や応用事例なのも新しい知識を得られてマル。2021/11/06

suzuki

5
2019年時点の深層強化学習について、コードサンプルを使いつつ説明している。 書いてあることの2割以上は理解できていないし、公私にわたり強化学習モデルを実装することは現状ほぼ無いのでコードサンプルは読み飛ばしたものの、 自分はG検定の補助教材として活用し、本書を眺めることで強化学習まわりの知識を補強することができた。 2024/09/07

レモン爆弾

1
第2章の理論が難解だが,コピー用紙にメモしながら理解すれば何とかなるが,それでも結構難しい。強化学習を始めて学ぶひとは,”ロボットインテリジェンス”という本をお勧めする。これはExcelVBAを使った強化学習解説本で基本のQ学習を理解できる。2019/11/30

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/14004977
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。

最近チェックした商品