出版社内容情報
アルファ碁ゼロで利用されている深層学習・強化学習の仕組みがわかる!【本書の概要】
本書は学術論文(NatureやGoogleのサイト)などで提供されている難解なアルファ碁およびアルファ碁ゼロの仕組みについて、
著者がとりまとめ、実際の囲碁の画面を見ながら、
アルファ碁およびアルファ碁ゼロで利用されている深層学習や強化学習の仕組みについてわかりやすく解説した書籍です。
特にデュアルネットワークはまったく新しい深層学習の手法で国内外の技術者の関心を集めています。
本書を読むことで、最新AIの深層学習、強化学習の仕組みを知ることができ、
自身の研究開発の参考にできます。また著者の開発したDeltaGoを元に実際に囲碁AIを体験できます。
【増補改訂のポイント】
Chapter1から5の部分は、よりわかりやすく内容を加筆修正しています。
またChapter6はアルファ碁ゼロに対応しています。
改訂にあたり、色数も2Cに変更。よりわかりやすいビジュアルになっています。
【対象読者】
人工知能関連の開発者、研究者
【著者プロフィール】
大槻知史(おおつき・ともし)
2001年東京大学工学部計数工学科卒業。2003年同大学院新領域創成科学研究科複雑理工学専攻修士課程修了。
以降、機械学習・最適化などの研究開発に取り組む。ゲームAIプログラマとしては、2001年より、囲碁・将棋プログラムの開発に従事。
著者の開発した将棋プログラム「大槻将棋」は、2009年世界コンピュータ将棋選手権にて第2位。博士(情報理工学)。
【監修者プロフィール】
三宅陽一郎(みやけ・よういちろう)
デジタルゲームの人工知能の開発者。京都大学で数学を専攻、大阪大学大学院物理学修士課程、
東京大学大学院工学系研究科博士課程を経て、人工知能研究の道へ。
ゲームAI開発者としてデジタルゲームにおける人工知能技術の発展に従事。
国際ゲーム開発者協会日本ゲームAI専門部会設立(チェア)、日本デジタルゲーム学会理事、芸術科学会理事、人工知能学会編集委員。
共著『デジタルゲームの教科書』『デジタルゲームの技術』『絵でわかる人工知能』(SBクリエイティブ)、
著書『人工知能のための哲学塾』(BNN新社)、『人工知能の作り方』(技術評論社)、
『ゲーム、人工知能、環世界』(現代思想、青土社、2015年12月)、
最新の論文は『デジタルゲームにおける人工知能技術の応用の現在』(人工知能学会誌 2015年、学会Webにて公開)。
【目次】
はじめに
監修者のことば
本書の対象読者とダウンロードファイルについて
囲碁AIの歴史
対局レポート:アルファ碁と世界ナンバーワン棋士・柯傑九段の最終決戦
Chapter1 アルファ碁の登場
01 ゲームAIの歴史と進歩
02 天才デミス・ハサビスの登場
03 アルファ碁の活躍
04 囲碁AIの基礎
05 まとめ
Chapter2 ディープラーニング?囲碁AIは瞬時にひらめく?
本章で説明する技術トピックと、全体の中の位置づけ
01 ディープラーニングとは
02 手書き数字認識の例
03 アルファ碁における畳み込みニューラルネットワーク
04 ChainerでCNNを学習させてみる
05 まとめ
Chapter3 強化学習?囲碁AIは経験に学ぶ?
本章で説明する技術トピックと、全体の中の位置づけ
01 強化学習とは
02 強化学習の歴史
03 多腕バンディット問題
04 迷路を解くための強化学習
05 テレビゲームの操作獲得のための強化学習
06 アルファ碁における強化学習
07 まとめと課題
Chapter4 探索?囲碁AIはいかにして先読みするか?
本章で説明する技術トピックと全体の中の位置づけ
01 2人ゼロ和有限確定完全情報ゲーム
02 ゲームにおける探索
03 従来のゲーム木探索(ミニマックス木探索)
04 囲碁におけるモンテカルロ木探索
05 モンテカルロ木探索の成功要因と課題
06 まとめ
Chapter5 アルファ碁の完成
01 アルファ碁の設計図
02 非同期方策価値更新モンテカルロ木探索(APV-MCTS)
03 大量のCPU・GPUの利用
04 アルファ碁の強さ
Chapter6 アルファ碁からアルファ碁ゼロへ
01 はじめに
02 アルファ碁ゼロにおけるディープラーニング
03 アルファ碁ゼロにおけるモンテカルロ木探索
04 アルファ碁ゼロにおける強化学習
05 アルファ碁ゼロの強さ
06 アルファ碁ゼロは知識ゼロから作られたのか?
07 アルファ碁やアルファ碁ゼロに弱点はあるのか?
08 アルファ碁ゼロの先の未来
Appendix1 数式について
01 畳み込みニューラルネットワークの学習則の導出
02 強化学習の学習則の導出
Appendix2 囲碁プログラム用のUIソフト「GoGui」およびGoGui用プログラム「DeltaGo」の利用方法
01 DeltaGoとは
02 GoGuiのインストールとGoGui用プログラム「DeltaGo」の利用方法
おわりに
INDEX
大槻 知史[オオツキ トモシ]
著・文・その他
三宅 陽一郎[ミヤケ ヨウイチロウ]
監修
内容説明
2017年5月、アルファ碁と柯潔(カ・ケツ)九段の最終決戦が行われ、アルファ碁の3連勝となりました。アルファ碁の進化はこの後も続き、2017年10月にはアルファ碁ゼロに関する論文が発表、従来のアルファ碁に100連勝したことが報告されました。このように人工知能の技術は日進月歩で進んでいます。人工知能において最近注目されているのは、機械学習・深層学習・強化学習の分野です。本書は科学ジャーナル誌『Nature』に掲載されたアルファ碁およびアルファ碁ゼロに関する難解な学術論文を、著者が読み解き、アルファ碁に利用されている深層学習や強化学習、モンテカルロ木探索、およびアルファ碁ゼロに利用されているデュアルネットワークの仕組みについて、わかりやすく解説した書籍です。本書を読むことで、最新の人工知能の技術がアルファ碁およびアルファ碁ゼロにどのように利用されているかを知るとともに、人工知能の技術を研究開発に生かすためのヒントが得られます。
目次
1 アルファ碁の登場
2 ディープラーニング―囲碁AIは瞬時にひらめく
3 強化学習―囲碁AIは経験に学ぶ
4 探索―囲碁AIはいかにして先読みするか
5 アルファ碁の完成
6 アルファ碁からアルファ碁ゼロへ
Appendix1 数式について
Appendix2 囲碁プログラム用のUIソフト「GoGui」およびGoGui用プログラム「DeltaGo」の利用方法
著者等紹介
大槻知史[オオツキトモシ]
2001年東京大学工学部計数工学科卒業。2003年同大学院新領域創成科学研究科複雑理工学専攻修士課程修了。以降、機械学習・最適化などの研究開発に取り組む。ゲームAIプログラマとしては、2001年より、囲碁・将棋プログラムの開発に従事。著者の開発した将棋プログラム「大槻将棋」は、2009年世界コンピュータ将棋選手権にて第2位。博士(情報理工学)
三宅陽一郎[ミヤケヨウイチロウ]
デジタルゲームの人工知能の開発者。京都大学で数学を専攻、大阪大学大学院物理学修士課程、東京大学大学院工学系研究科博士課程を経て、人工知能研究の道へ。ゲームAI開発者としてデジタルゲームにおける人工知能技術の発展に従事。国際ゲーム開発者協会日本ゲームAI専門部会設立(チェア)、日本デジタルゲーム学会理事、芸術科学会理事、人工知能学会編集委員(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
kochi
やすほ
じんじょ
ブリトニー
ひろし
-
- 和書
- 簿記の基本