内容説明
人より強い将棋プログラムを作ろう
2016年3月、プロ棋士に勝つには後10年かかると言われていたコンピュータ囲碁でAlphaGoがトップ棋士に勝利しました。そこで使われた手法がディープラーニングです。
AlphaGoは局面を「画像」として認識し、打ち手の確率と局面の勝率を予測することで、次の打ち手を決めています。画像とはどのようなものか、次の打ち手をどうやって決めるのか?AlphaGoの論文をヒントに、ディープラーニングを使い棋譜を学習した将棋AIの開発を行います。強化学習のみでトップレベルの強さを持つAlphaZeroの手法も取り入れています。
[導入編]では、コンピュータ将棋の歴史とディープラーニングの関係、コンピュータ将棋の大会の概要を紹介します。
[理論編]では、従来のコンピュータ将棋のアルゴリズム、コンピュータ囲碁で用いられているモンテカルロ木探索とAlphaGoがどのようにディープラーニングを応用したか。基礎的な知識について解説しつつ、これらを将棋AIに応用する方法について述べます。
[実践編]では、ディープラーニングを使った以下の3つの将棋AIについて、PythonとChainerで実装していきます。
方策ネットワーク(policy network)を使って指し手の予測のみでプレイするAI
価値ネットワーク(value network)を使って1手探索を行うAI
方策ネットワークと価値ネットワークを使ってモンテカルロ木探索を行うAI
最後に、より強い将棋AIを作りたいという方のために、ヒントとなる情報を紹介します。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
たいそ
6
2018年。ディープラーニングでなんとなく手書きの数字の判別とかができることがわかったとして、では、それを応用して何かできんかな?という時に読むと良いのかも。ニューラルネットワークとそれ以外のアルゴリズム、分類と回帰問題のニューラルネットワークといった複数のアルゴリズムの組み合わせているところなどおもしろかった。機械学習の場合、自分で多量のデータを用意するのはハードルが高いが、棋譜データは比較的入手しやすいのが良い。ただしGPUは必須という規模で、そこのハードルは自分には高かった。2019/06/08
野々村 聡
1
☆☆☆☆☆ なるほど。何がどうなのか。どう理解していくべきなのか、自分は今どこにいるのか、そうしたものがすげえよく把握できた。 やっぱそうなんだなあ……ちょっと前なら多分何一つ分からなかったに違いない。今ならけっこう分かる。何が分からんかも分かる。 ちょっと手応えを感じた。2019/12/18
-
- 電子書籍
- 嫌われ勇者に転生したので愛され勇者を目…
-
- 電子書籍
- 【デジタル限定】松本まりか写真集「夏の…
-
- 電子書籍
- ぽちゃまに 1巻 花とゆめコミックス
-
- 電子書籍
- 相田みつを ザ・ベスト にんげんだもの…