出版社内容情報
R. Sutton[リチャードサットン]
原著
A. Barto[アンドリューバート]
原著
奥村 エルネスト 純[オクムラエルネストジュン]
監修/翻訳
鈴木 雅大[スズキ マサヒロ]
監修/翻訳
松尾 豊[マツオ ユタカ]
監修/翻訳
三上 貞芳[ミカミ サダヨシ]
監修/翻訳
山川 宏[ヤマカワ ヒロシ]
監修/翻訳
今井 翔太[イマイ ショウタ]
翻訳
川尻 亮真[カワジリ リョウマ]
翻訳
菊池 悠太[キクチ ユウタ]
翻訳
鮫島 和行[サメジマ カズユキ]
翻訳
陣内 佑[ジンナイ ユウ]
翻訳
?橋 将文[タカハシ マサフミ]
翻訳
谷口 尚平[タニグチ ショウヘイ]
翻訳
藤田 康博[フジタ ヤスヒロ]
翻訳
前田 新一[マエダ シンイチ]
翻訳
松嶋 達也[マツシマ タツヤ]
翻訳
内容説明
発展的手法、心理学・神経科学との関係、AlphaGoなどの新しい話題を大幅増補。
目次
第1部 テーブル形式の解法(多腕バンディット問題;有限マルコフ決定過程;動的計画法 ほか)
第2部 近似による解法(近似を用いた方策オン型予測;関数近似を用いた方策オン型制御;近似を用いた方策オフ型手法 ほか)
第3部 さらに深く(心理学;神経科学;応用と事例紹介 ほか)
-
- 和書
- 追悼者 文春文庫