出版社内容情報
テキストに対応する画像を生成する――従来は困難であった高次元のデータを創り出す生成モデルの技術が注目されている。現在、最高の性能を発揮し、画像・動画・音声・化合物の生成など、多様な応用が期待されているのが拡散モデルである。その数理の心から課題までを世界に先駆けて解説し、理論のさらなる発展を追究する。
内容説明
多様で高品質な画像を生成し、人々を驚かせているアプリケーションは、どのような理論と技術により可能になったのか。従来は困難であった高次元のデータを創り出す生成モデルが注目されている。現在、最高の性能を発揮し、画像・動画・音声・化合物の生成など、多様な応用が期待されているのが拡散モデルである。その数理の本質から課題までを世界に先駆けて解説し、理論のさらなる発展を追究する。
目次
1 生成モデル(生成モデルとは何か;エネルギーベースモデル・分配関数 ほか)
2 拡散モデル(スコアベースモデルとデノイジング拡散確率モデル;スコアベースモデル ほか)
3 連続時間化拡散モデル(確率微分方程式;SBMとDDPMのSDE表現 ほか)
4 拡散モデルの発展(条件付き生成におけるスコア;分類器ガイダンス ほか)
5 アプリケーション(画像生成・超解像・補完・画像変換;動画・パノラマ生成 ほか)
付録
著者等紹介
岡野原大輔[オカノハラダイスケ]
1982年生まれ。2010年東京大学大学院情報理工学系研究科博士課程修了、情報理工学博士。2006年Preferred Infrastructureを共同で創業、2014年Preferred Networks(PFN)を共同で創業。PFN代表取締役最高研究責任者およびPreferred Computational Chemistry代表取締役社長を務める(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
月をみるもの
shin_ash
nos
yyhhyy
水紗枝荒葉