出版社内容情報
LLM(大規模言語モデル)による自然言語処理をハンズオン形式で詳説!
急速に進化する大規模言語モデル(LLM)を、視覚的に理解しながら実践的に学べるハンズオンガイド。本書では、Jupyter Notebookやクラウド上で実際にモデルを動かしながら学ぶことができます。大規模言語モデルに欠かせないTransformerの仕組みをはじめ、要約、セマンティック検索、テキスト分類、クラスタリング、RAG(検索拡張生成)といった技術も、図解とともに直感的に理解できます。豊富なコード例と既存ライブラリの活用法を通じて、直感を重視したアプローチでLLMを学びたい読者に最適な一冊です。
内容説明
急速に進化する大規模言語モデル(LLM)を、視覚的に理解しながら実践的に学べるハンズオンガイド。本書では、Jupyter Notebookやクラウド上で実際にモデルを動かしながら学ぶことができます。大規模言語モデルに欠かせないTransformerの仕組みをはじめ、要約、セマンティック検索、テキスト分類、クラスタリング、RAG(検索拡張生成)といった技術も、図解とともに直感的に理解できます。豊富なコード例と既存ライブラリの活用法を通じて、直感を重視したアプローチでLLMを学びたい読者に最適な一冊です。
目次
第1部 言語モデルの理解(入門 大規模言語モデル;トークンと埋め込み;大規模言語モデルの仕組み)
第2部 事前学習済み言語モデルの活用(テキスト分類;テキストクラスタリングとトピックモデリング;プロンプトエンジニアリング;高度なテキスト生成のテクニックとツール;セマンティック検索とRAG;マルチモーダルな大規模言語モデル)
第3部 言語モデルの学習とファインチューニング(テキスト埋め込みモデルの作成;分類モデルのファインチューニング;生成モデルのファインチューニング)
著者等紹介
アラマー,ジェイ[アラマー,ジェイ] [Alammar,Jay]
Cohere社のディレクター兼エンジニアリングフェロー。大規模言語モデルをAPIとして提供する企業のCohere社で、企業や開発者コミュニティに対して言語モデルの使い方を教え、実際の業務に生かすための方法をアドバイスしている。人気のブロガーでもあり、「AI/MLブログ」を通じて、何百万人もの研究者やエンジニアに機械学習ツールや概念をわかりやすく説明してきた。ブログ記事の内容は、基本的な技術(NumPyやpandasのようなパッケージのドキュメントに反映されるもの)から、最新の技術(Transformers、BERT、GPT-3、Stable Diffusion)までさまざま。また、Deeplearning.aiやUdacityで提供される人気の機械学習および自然言語処理コースの共同開発者でもある
グーテンダースト,マルテン[グーテンダースト,マルテン] [Grootendorst,Maarten]
オランダがんセンター(IKNL)のシニア臨床データサイエンティスト。組織心理学、臨床心理学、データサイエンスの修士号を持ち、その知識を生かして複雑な機械学習の概念を幅広い聴衆にわかりやすく伝えることが得意。ブログも人気があり、心理学の観点からAIの基本を解説する内容で、数百万人の読者にリーチしている。また、BERTopic、PolyFuzz、KeyBERTなど、大規模言語モデルを活用したオープンソースパッケージの開発者兼メンテナーでもある。これらのパッケージは、世界中のデータ専門家や組織によって何百万回もダウンロードされている
中山光樹[ナカヤマヒロキ]
OSSデベロッパー。GitHub上で自然言語処理用の評価ツールやアノテーションツールをメンテナンスしている(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。