出版社内容情報
★★検索の基本原理からLLMによる生成検索まで、現代の検索システムを一望できる一冊★★
基本原理から、索引語検索、ベクトル検索、生成検索といった主要なアーキテクチャ、そして機械学習を用いた改善や評価、さらにランキング学習、検索拡張生成(RAG)、検索エンジン最適化(SEO)などの発展的な話題までを幅広く解説。
現代の検索システムを、これまでにない解像度で理解できる!
これから社内に検索システムを導入しようと考えているエンジニアの方はもちろん、なぜ検索システムが欲しい情報を見つけてくれるのか、あるいはなぜ見つからないのか、その理由が知りたい方にも役立つ一冊です。
【Pythonコード付き】
【主な内容】
第1章 はじめに
第2章 検索システムの概要
第3章 索引語検索
第4章 ベクトル検索
第5章 生成検索
第6章 評価手法
第7章 ランキングの改善
第8章 発展的話題
第9章 おわりに
【目次】
第1章 はじめに
1.1 検索システムとは
1.2 償却
1.3 他分野とのかかわり
1.4 本書で扱うトピック
1.5 用語の整理
1.6 サポートサイト
第2章 検索システムの概要
2.1 問題設定
2.2 マッチングとランキング
2.3 索引語検索
2.4 ベクトル検索
2.5 生成検索
2.6 代表的な検索システムソフトウェア
第3章 索引語検索
3.1 転置インデックス
3.2 トークン分割と語彙目録の作成
3.3 TF-IDFとBM25
3.4 クエリと文書の拡張
3.5 語彙目録のデータ構造とアルゴリズムの詳細
3.6 転置インデックスのデータ構造とアルゴリズムの詳細
3.7 Pythonプログラム例
第4章 ベクトル検索
4.1 埋め込み
4.2 最近傍探索
4.3 近似最近傍探索
4.4 近似最近傍探索の仕組み
4.5 埋め込みモデルとその訓練
4.6 Pythonプログラム例
第5章 生成検索
5.1 大規模言語モデルと知識
5.2 全文プロンプトと長文脈モデル
5.3 検索拡張生成(RAG)
5.4 エージェントを用いた検索
5.5 Pythonプログラム例
第6章 評価手法
6.1 オフライン評価
6.2 オンライン評価
第7章 ランキングの改善
7.1 リンク解析による信頼性分析(ページランク)
7.2 ランキング学習
7.3 検索の個別化
7.4 Pythonプログラム例
第8章 発展的話題
8.1 データの収集と前処理
8.2 フィルターバブル
8.3 公平性
8.4 多様性
8.5 検索エンジン最適化(SEO)
第9章 おわりに
9.1 文献案内



