実践Pythonによるベイズ分析とトピックモデル - 先進的なデータ分析へのアプローチ

個数:1
紙書籍版価格
¥3,740
  • 電子書籍
  • ポイントキャンペーン

実践Pythonによるベイズ分析とトピックモデル - 先進的なデータ分析へのアプローチ

  • 著者名:藤野巖
  • 価格 ¥3,740(本体¥3,400)
  • コロナ社(2025/01発売)
  • GWに本を読もう!Kinoppy 電子書籍・電子洋書 全点ポイント30倍キャンペーン(~5/6)
  • ポイント 1,020pt (実際に付与されるポイントはご注文内容確認画面でご確認下さい)
  • ISBN:9784339029437

ファイル: /

内容説明

ベイズ分析,トピックモデルの基本事項を理論と実践の両方から解説する。無理なくステップアップできる構成を意識するとともに,文書データ,画像データ,軌跡データの解析についてプログラムを作成しながら学習できるよう配慮した。

目次

1. 確率と確率分布
1.1 確率と確率分布
 1.1.1 確率
 1.1.2 確率分布
1.2 条件確率と同時確率
 1.2.1 条件確率
 1.2.2 同時確率
1.3 乗法定理とベイズの定理
 1.3.1 乗法定理
 1.3.2 ベイズの定理
1.4 各種確率分布
 1.4.1 ベルヌーイ分布
 1.4.2 二項分布
 1.4.3 カテゴリ分布
 1.4.4 正規分布(1次元ガウス分布)
 1.4.5 指数分布
 1.4.6 ベータ分布
 1.4.7 ガンマ分布
 1.4.8 ディリクレ分布
1.5 Scipyの確率統計モジュールstats
1.6 Pythonによる各種確率分布のプログラム
演習問題

2. データの統計分析の基本
2.1 統計分析
2.2 Pandasとは
 2.2.1 シリーズ
 2.2.2 データフレーム
2.3 Pandasの基本的な使い方
2.4 Pandasによる統計分析のプログラム例
演習問題

3. ベイズ分析の基本
3.1 ベイズ分析の基本的な考え方
3.2 PyMCの使い方(その1)
3.3 Arvizについて
3.4 PyMCによるサンプリングプログラム
 3.4.1 ベルヌーイ分布からのサンプリング
 3.4.2 正規分布からのサンプリング
3.5 PyMCによるパラメータ推定のプログラム
 3.5.1 ベルヌーイ分布のパラメータ推定
 3.5.2 正規分布のパラメータ推定
演習問題

4. 文書データ分析の基本
4.1 形態素解析とMeCab
4.2 Bag of Words
4.3 文書データの数値化
 4.3.1 単語の出現回数
 4.3.2 TFIDF
 4.3.3 Scikit-learnライブラリによるTFIDF単語文書行列の実現法
 4.3.4 TFIDF単語文書行列を計算するプログラム例
4.4 コサイン類似度
 4.4.1 コサイン類似度の計算式
 4.4.2 Scikit-learnライブラリによるコサイン類似度の実現法
 4.4.3 コサイン類似度を計算するプログラム例
演習問題

5. ユニグラムモデル
5.1 文書生成の確率モデル
5.2 グラフィカルモデル表現
5.3 ユニグラムモデル
 5.3.1 ユニグラムモデルとは
 5.3.2 文書集合を生成するプログラム
 5.3.3 文書集合の単語出現頻度のプログラム
5.4 ユニグラムモデルのパラメータ推定
 5.4.1 データ分析とモデル
 5.4.2 PyMCによるユニグラムモデルのパラメータ推定
 5.4.3 ユニグラムモデルにおけるカテゴリ分布の発生確率推定
演習問題

6. 混合ユニグラムモデル
6.1 混合ユニグラムモデル
6.2 文書集合(複数の文書)の生成
6.3 PyMCの使い方(その2)
6.4 混合ユニグラムモデルにおけるトピック別単語分布の推定
演習問題

7. トピックモデル
7.1 トピックモデル
7.2 文書集合(複数の文書)の生成
7.3 トピックモデルにおけるカテゴリ分布のパラメータ推定
7.4 保存済み推定結果の利用
 7.4.1 トピック別の単語の出現確率順表示
 7.4.2 文書別トピック割合の表示
演習問題

8. Scikit-learnライブラリによるトピックモデル
8.1 20ニュースグループデータセット
8.2 英語文書の形態素解析
8.3 Scikit-learnのトピックモデルライブラリ
8.4 20ニュースグループデータセットから単語集合を用意する
8.5 20ニュースグループの単語集合からトピックを抽出する
8.6 トピック別の上位単語を取り出す
演習問題

9. Gensimライブラリによるトピックモデル
9.1 Wikipedia記事の単語集合の作成
9.2 Gensimを用いたトピック解析
9.3 Wikipediaデータセットへのトピックモデルの適用
9.4 トピック別の上位単語と文書別のトピックの取り出し
演習問題

10. 著者トピックモデル
10.1 著者トピックモデル
10.2 PyMCによる著者トピックモデルの実現
 10.2.1 著者トピックモデルに基づいたデータセットの作成
 10.2.2 PyMCによる著者トピックモデルの実現
10.3 Gensimによる著者トピックモデル
 10.3.1 Gensimの著者トピックモデルクラス
 10.3.2 Twitterデータからのデータセットの準備
 10.3.3 Twitterデータセットへの著者トピックモデルの適用
演習問題

11. 画像データセットからのトピック抽出
11.1 画像データにトピックモデルを適用するための予備知識
 11.1.1 画像データの仕組み
 11.1.2 Matplotlibによる画像の読込みと表示
 11.1.3 ベクトル量子化とコードの作成
11.2 画像データセットを用いた画像の文書集合の作成
11.3 画像の文書集合へのトピックモデルの適用
11.4 トピックモデルによる処理結果の可視化
演習問題

12. 船舶の航跡データからのトピック抽出
12.1 AISデータにトピックモデルを適用するための予備知識
 12.1.1 AISデータ
 12.1.2 Basemapによる地図情報の表示
 12.1.3 Basemapによる航跡の表示
12.2 AISデータセットを用いた航跡の文書集合の作成
12.3 航跡のコード文書集合へのトピックモデルの適用
12.4 トピックをコードから航跡に復元
演習問題

付録
参考文献
索引

最近チェックした商品