出版社内容情報
本書は深層ニューラルネットワークによる予測を高速化する技法を解説します。巨大なニューラルネットワークを用いた予測には多くの時間と計算コストがかかります。これにより、応答が遅くなりユーザー体験が悪くなるといった問題や、運用コストが大きくなるといった問題が生じます。本書はニューラルネットワークの予測性能を下げることなく高速化することでこれらの問題を解決する技法を解説します。紹介する技法は量子化・枝刈り・蒸留・低ランク近似・モデルマージなど多岐にわたり、幅広い局面に対応します。また、平坦解や宝くじ仮説など、深層ニューラルネットワークの理論を通して、これらの手法がうまくいく理由についても深く本質的な理論を解説します。深層ニューラルネットワークを活用するエンジニアや研究者は必読の一冊です。
内容説明
推論のしくみから紐解く高速化の原理。
目次
第1章 はじめに
第2章 高速化手法の概要
第3章 量子化と低精度化
第4章 枝刈り
第5章 蒸留
第6章 低ランク近似
第7章 高速なアーキテクチャ
第8章 チューニングのためのツール
第9章 効率的な訓練
著者等紹介
佐藤竜馬[サトウリョウマ]
1996年生まれ。2024年京都大学大学院情報学研究科博士課程修了。博士(情報学)。現在、国立情報学研究所助教。専門分野はグラフニューラルネットワーク、最適輸送、および情報検索・推薦システム。NeurIPSやICMLなどの国際会議に主著論文が採択。競技プログラミングでは国際情報オリンピック日本代表、ACM‐ICPC世界大会出場、AtCoderレッドコーダーなどの戦績をもつ。PDF翻訳サービスReadableを開発し、深層ニューラルネットワークを用いた翻訳システムにも詳しい(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
-
- 電子書籍
- 薔薇のためいき〈薔薇色の疑惑Ⅰ〉【分冊…