出版社内容情報
ゲームAIやロボットアームの制御、自動運転などで注目の深層強化学習の基礎と、Pythonによる実装について解説した入門書。深層強化学習の入門から実装まで、この一冊でわかる!
アルファ碁などのゲームAIやロボットアームの制御、自動運転などで注目されている深層強化学習の基礎と、Pythonによる実装について解説した入門書です。
強化学習に適したライブラリであるChainer(ChainerRL)と、AIシミュレーション環境であるOpenAI gymを用いて解説しています。
ソフトウェアシミュレーションだけでなくRaspberryPiとArduinoを用いた実環境への応用も解説しているので、ソフト・ハード問わず自身の課題に深層強化学習を応用することできるようになっています。
1章 はじめに
2章 深層学習
3章 強化学習
4章 深層強化学習
5章 実環境への応用
付録
付録1 VirtualBoxのインストール
付録2 RaspberryPiの設定
付録3 Arduinoのインストール
付録4 Graphical Processing Unit(GPU)の利用
付録5 Intel Math Kernel Libraryを用いたNumPyのインストール
牧野 浩二[マキノ コウジ]
著・文・その他
西崎 博光[ニシザキ ヒロミツ]
著・文・その他
内容説明
Pythonで動作する深層強化学習フレームワーク「ChainerRL」を用いて、深層強化学習を実際に使いこなすことに焦点を当て、開発環境の構築から深層学習、強化学習、深層強化学習とステップアップ方式で、基礎から実際のモノを制御する応用までを解説。
目次
第1章 はじめに(深層強化学習でできること;本書の構成 ほか)
第2章 深層学習(深層学習とは;ニューラルネットワーク ほか)
第3章 強化学習(強化学習とは;強化学習の原理 ほか)
第4章 深層強化学習(深層強化学習とは;ネズミ学習問題への適用 ほか)
第5章 実環境への応用(カメラで環境を観察する(MNIST)
実環境でのネズミ学習問題 ほか)
著者等紹介
牧野浩二[マキノコウジ]
1975年神奈川県横浜市生まれ。1994年神奈川県立横浜翠嵐高等学校卒業。2001年東京工業大学大学院理工学研究科制御システム工学専攻修了。株式会社本田技術研究所研究員。2008年東京工業大学大学院理工学研究科制御システム工学専攻修了。博士(工学)。財団法人高度情報科学技術研究機構研究員。2009年東京工科大学コンピュータサイエンス学部助教。2013年山梨大学大学院総合研究部工学域助教。これまでに地球シミュレータを使用してナノカーボンの研究を行い、Arduinoを使ったロボコン型実験を担当した。マイコンからスーパーコンピュータまでさまざまなプログラミング経験を持つ。おもに、人間の暗黙知(分かっているけど言葉に表せないエキスパートが持つ知識)に取り組んでおり、計測機器開発からデータ解析まで一貫した研究を行っている
西崎博光[ニシザキヒロミツ]
1975年兵庫県佐用町生まれ。1996年津山工業高等専門学校情報工学科卒業。2003年豊橋技術科学大学大学院工学研究科博士課程電子・情報工学専攻修了。博士(工学)。山梨大学大学院医学工学総合研究部助手。2015年国立台湾大学電機情報学院客員研究員。2016年山梨大学大学院総合研究部工学域准教授。おもに、音声情報処理の研究に取り組んでおり、特に音声認識や大規模音声データベースから該当する音声を見つけ出す音声ドキュメント検索の研究を行っている。最近では、音声認識や検索技術を活かしたノートテイキングや技術伝承支援の研究に従事している(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。