出版社内容情報
注目の最新AI技術!深層強化学習の開発手法がわかる!
第一線で活躍する著者陣の書下ろしによる待望の1冊!
【本書の目的】
Alpha Go(アルファ碁)でも利用されている深層強化学習。
AIサービスのみならずロボティクス分野でもその応用が期待されています。
本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。
【本書の特徴】
第1部では、まず、深層強化学習の概要について説明します。
次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。
さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。
第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。
1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。
2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。
3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。
全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。
【読者が得られること】
深層強化学習による開発手法を学ぶことができます。
【対象読者】
深層強化学習を学びたい理工学生・エンジニア
内容説明
AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。
目次
1 基礎編(強化学習の有用性;強化学習のアルゴリズム;深層学習による特徴抽出;深層強化学習の実装)
2 応用編(連続制御問題への応用;組合せ最適化への応用;系列データ生成への応用)
APPENDIX 開発環境の構築
著者等紹介
伊藤多一[イトウタイチ]
1995年名古屋大学大学院理学研究科博士課程修了。博士(理学)。2004年3月まで素粒子物理学の研究に従事。同年、受託データ分析を専業とするベンチャー企業に入社、数々のデータ分析案件に携わる。2013年よりブレインパッド社にて機械学習による広告効果分析などに携わる。2016年以降は深層学習による画像解析案件にも携わる
今津義充[イマズヨシミツ]
素粒子・原子核物理学の研究を通して統計分析・モデル構築、数値シミュレーションに精通。2013年よりブレインパッド社にて需要予測や数理最適化などの定量分析案件を主導。近年は深層学習技術を活用した分析案件や応用研究に従事。博士(理学)
須藤広大[スドウコウダイ]
1年間の世界放浪の後、奈良先端科学技術大学院大学で自然言語処理学を専攻。修士(情報工学)。新卒でブレインパッド社に入社し、機械学習エンジニアとして、深層学習に関連した分析・開発案件に携わる
仁ノ平将人[ニノヒラマサト]
大学院では経営システム工学を専攻し、2018年にデータサイエンティストとしてブレインパッド社に新卒入社。入社後は強化学習や自然言語処理を用いた案件に従事。修士(工学)
川崎悠介[カワサキユウスケ]
大学では情報工学を専攻し、2018年にブレインパッド社に入社。画像認識・時系列予測を用いた案件に携わる。修士(工学)
酒井裕企[サカイユウキ]
2018年、大学院では素粒子論を専攻し、学位取得後はデータサイエンティストとしてブレインパッド社に新卒入社、自社プロダクトにまつわるデータ分析案件に携わる。博士(理学)
魏崇哲[ウェイチョンチェア]
2011年、オークランド大学大学院機械工学科修士課程修了。修士(機械工学)。卒業後、Foxconnに入社、ロボットの研究開発に携わる。2018年にブレインパッド社に入社、深層学習と強化学習による画像分析とゲームAI開発案件に携わる(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
vinlandmbit
kaida6213
suzuki
レモン爆弾
-
- 和書
- 開発の文化人類学