商品詳細
※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。
近年、画像生成技術は急速な進化を遂げ、特に2022年の「Stable Diffusion」公開以降、テキストから画像を生成するAIが広く普及しています。本書はこの革新的な技術の基礎から応用までを網羅し、読者が画像生成を深く理解することを目的としています。第1章では画像生成の概要を学びます。同時に技術の急速な発展に伴う倫理的な課題やリスクについても考察します。第2章では画像生成の基盤となる深層学習の基礎を、現代の主流であるTransformerモデルに焦点を当てて解説します。第3章では生成モデルの概念と、画像生成を飛躍的に進歩させた拡散モデルの基礎理論を解説します。第4章では拡散モデルの進化形である潜在拡散モデルとStable Diffusionについて解説します。第5章では拡散モデルをもとに、画像生成にとどまらないさまざまな応用について紹介します。第6章では画像生成技術の今と未来を考察します。
表紙
本書の前提
目次
序章
第1章 画像生成とは?
第1節 画像生成の概要
第2節 テキストからの画像生成
第3節 画像生成技術の進歩による弊害
コラム:すべてを救うPythonの型ヒント
第2章 深層学習の基礎知識
第1節 深層学習の概要
第2節 深層学習の訓練と評価
第3節 注意機構とTransformerモデル
コラム:dataclassで万物に型を付けよう
第3章 拡散モデルの導入
第1節 生成モデル
第2節 DDPM(ノイズ除去拡散確率モデル)
第3節 スコアベース生成モデル
第4節 拡散モデルの生成品質の向上
コラム:Pythonのコードを美しく保つには
第4章 潜在拡散モデルとStable Diffusion
第1節 LDM(潜在拡散モデル)
第2節 CLIP
第3節 Stable Diffusionを構成する要素
第4節 Stable Diffusion v1
第5節 Stable Diffusion v2
第6節 Stable Diffusion XL
第7節 Stable Diffusion v3
コラム:深層学習を用いた実験を再現可能にするために気をつけること
第5章 拡散モデルによる画像生成技術の応用
第1節 パーソナライズされた画像生成
第2節 制御可能な画像生成
第3節 拡散モデルによる画像編集
第4節 画像生成モデルの学習および推論の効率化
第5節 学習済み拡散モデルの効果的な拡張
第6節 生成画像の倫理・公平性
コラム:diffusersのコードを拡張する
第6章 画像生成の今後
第1節 拡散モデルの発展に伴う議論
第2節 拡散モデルによる画像生成の倫理
第3節 画像生成にとどまらない拡散モデルの進化と今後
コラム:Hugging Faceのエコシステムを使い倒す
参考文献
索引
著者プロフィール
奥付
著者情報
北田俊輔[キタダシュンスケ]
LINEヤフー株式会社リサーチサイエンスティスト・法政大学大学院特任研究員。2023年3月に法政大学大学院理工学研究科を修了。博士(工学)。日本学術振興会特別研究員(DC2)を経て現職。コンピュータビジョンや自然言語処理を始め、その融合領域であるVision&Language分野にて研究に従事。現在はユーザにとって魅力的な画像やデザインの作成を支援するような最先端技術の研究開発に携わる(本データはこの書籍が刊行された当時に掲載されていたものです)