出版社内容情報
Transformerモデルと拡散モデルによる生成AIをハンズオン形式で詳説!
最先端の生成AIを、手を動かしながら体得できる入門書。テキスト・画像・音声・動画といった幅広い生成AIの基本から、ファインチューニングやモデル評価などの応用までを、わかりやすく体系的に解説します。複雑な理論や高度な数学には深入りせず、事前訓練済みモデルとオープンソースライブラリを活用し、実際にコードを動かしながら学習可能。豊富なサンプルコードと解説を通じて、生成AIの仕組みを直感的に理解できます。専門知識がなくてもハンズオンで直感的に学べて、急速に進化するAI時代を生き抜く実践力も身につけられる一冊です。
【目次】
内容説明
最先端の生成AIを、手を動かしながら体得できる入門書。テキスト・画像・音声・動画といった幅広い生成AIの基本から、ファインチューニングやモデル評価などの応用までを、わかりやすく体系的に解説します。複雑な理論や高度な数学には深入りせず、事前訓練済みモデルとオープンソースライブラリを活用し、実際にコードを動かしながら学習可能。豊富なサンプルコードと解説を通じて、生成AIの仕組みを直感的に理解できます。専門知識がなくてもハンズオンで直感的に学べて、急速に進化するAI時代を生き抜く実践力も身につけられる一冊です。
目次
第1部 オープンモデルの実践的活用(生成メディア入門;Transformer;情報の圧縮と表現;拡散モデル;Stable Diffusionと条件付き生成)
第2部 生成モデルの転移学習(言語モデルのファインチューニング;Stable Diffusionのファインチューニング)
第3部 さらなる理解のために(テキストから画像生成モデルの創造的応用;音声の生成;生成AIで急速に進歩する領域)
付録A オープンソースツール
付録B 大規模言語モデルのメモリ要件
付録C RAG(検索拡張生成)



