入門 機械学習による異常検知 - Rによる実践ガイド

個数:1
紙書籍版価格
¥4,180
  • 電子書籍

入門 機械学習による異常検知 - Rによる実践ガイド

  • 著者名:井手剛
  • 価格 ¥4,180(本体¥3,800)
  • コロナ社(2021/05発売)
  • ポイント 38pt (実際に付与されるポイントはご注文内容確認画面でご確認下さい)
  • ISBN:9784339024913

ファイル: /

内容説明

機械学習技術を使って異常検知をやってみたい人のための実用ガイドである。異常検知にかかわる技術の断片をただ羅列せず,実問題を解く上でぶつかる困難に立ち向かうための方法を体系的に解説している。

目次

1. 異常検知の基本的な考え方
1.1 例題:健康診断
1.2 計算機に判定規則をつくらせたい
1.3 「確率分布」で正常パターンをつかむ
1.4 機械学習で確率分布を求める
1.5 やりたいことを具体的に整理する
1.6 異常の度合いを数値で表す
1.7 いろいろな手法を試してみる

2. 正規分布に従うデータからの異常検知
2.1 異常検知手順の流れ
2.2 1変数正規分布に基づく異常検知
 2.2.1 ステップ1:分布推定
 2.2.2 ステップ2:異常度の定義
 2.2.3 ステップ3:閾値の設定
 2.2.4 Rでの実行例
2.3 1変数のホテリング理論の詳細*
 2.3.1 1変数正規分布の最尤推定
 2.3.2 正規変数の和の確率分布(1次元)
 2.3.3 標本分散の確率分布(1次元)
 2.3.4 ホテリング統計量の確率分布(1次元)
2.4 多変量正規分布に基づく異常検知
 2.4.1 ステップ1:多次元正規分布の最尤推定
 2.4.2 ステップ2:異常度の定義
 2.4.3 ステップ3:閾値の設定(ホテリングのT2理論)
 2.4.4 Rでの実行例
2.5 多変数のホテリング理論の詳細*
 2.5.1 多変量正規変数の和の分布
 2.5.2 多変量正規変数の平方和の分布
 2.5.3 ホテリング統計量の分布
2.6 マハラノビス=タグチ法
 2.6.1 手法の概要
 2.6.2 Rでの実行例
 2.6.3 QR分解*
2.7 t分布による異常判定*
2.8 ホテリング理論の課題
章末問題

3. 非正規データからの異常検知
3.1 分布が左右対称でない場合
 3.1.1 ガンマ分布の当てはめ
 3.1.2 Rでの実行例
 3.1.3 カイ二乗分布による異常度の当てはめ
3.2 訓練データに異常標本が混ざっている場合
 3.2.1 正規分布の線形結合のモデル
 3.2.2 期待値?最大化法:期待値ステップ
 3.2.3 期待値?最大化法:最大化ステップ
 3.2.4 Rでの実行例
3.3 分布がひと山にならない場合:近傍距離に基づく方法
 3.3.1 k近傍法
 3.3.2 局所外れ値度
 3.3.3 カーネル密度推定
 3.3.4 Rでの実行例
3.4 分布がひと山にならない場合:クラスタリングに基づく方法
 3.4.1 k平均法
 3.4.2 混合正規分布モデル
 3.4.3 異常度の定義とRによる実行例
3.5 期待値?最大化法の詳細*
 3.5.1 イエンセンの不等式
 3.5.2 最大化ステップ
3.6 支持ベクトルデータ記述法に基づく異常判定
 3.6.1 データを囲む最小の球
 3.6.2 Rでの実行例
章末問題

4. 性能評価の方法
4.1 基本的な考え方
4.2 正常標本精度と異常標本精度
 4.2.1 正常標本に対する指標
 4.2.2 異常標本に対する指標
4.3 異常検出能力の総合的な指標
 4.3.1 分岐点精度とF値
 4.3.2 ROC曲線の下部面積
4.4 モデルのよさの検証
 4.4.1 モデル選択問題
 4.4.2 交差確認法
 4.4.3 赤池情報量規準とベイズ情報量規準
 4.4.4 赤池情報量規準と平均対数尤度*
 4.4.5 ベイズ情報量規準と周辺尤度*
章末問題

5. 不要な次元を含むデータからの異常検知
5.1 次元削減による異常検知の考え方
5.2 主成分分析による正常部分空間の算出
 5.2.1 分散最大化規準による正常部分空間
 5.2.2 ノルム最大化規準による正常部分空間
 5.2.3 二つの規準の等価性と特異値分解
5.3 主成分分析による異常検知
 5.3.1 異常度の定義
 5.3.2 ホテリングのT2との関係
 5.3.3 次元mの選択
 5.3.4 Rでの実行例
5.4 確率的主成分分析による異常検知*
 5.4.1 主成分分析の確率的モデル
 5.4.2 平均ベクトルの推定
 5.4.3 確率的主成分分析の期待値?最大化法
 5.4.4 σ2→0の極限と次元数mの決定
 5.4.5 確率的主成分分析による異常度の定義
5.5 カーネル主成分分析による異常検知*
 5.5.1 正常部分空間の算出
 5.5.2 Rでの実行例
 5.5.3 異常度の定義(m=1)
 5.5.4 異常度の定義(m>1)
章末問題

6. 入力と出力があるデータからの異常検知
6.1 入出力がある場合の異常検知の考え方
6.2 線形回帰モデルによる異常検知
 6.2.1 問題の定義
 6.2.2 最小二乗法としての最尤推定
 6.2.3 異常度の定義
6.3 リッジ回帰モデルと異常検知
 6.3.1 リッジ回帰の解
 6.3.2 定数λの決定
 6.3.3 異常度の定義
 6.3.4 Rでの実行例
6.4 偏最小二乗法と統計的プロセス制御(1次元出力)
 6.4.1 問題の設定
 6.4.2 正規直交基底による回帰モデルの変換
 6.4.3 NIPALS法(1次元出力)
 6.4.4 異常度の定義と異常検知手順
6.5 正準相関分析による異常検知
 6.5.1 問題設定
 6.5.2 一般化固有値問題としての正準相関分析
 6.5.3 特異値分解による解と異常検知
6.6 ベイズ的線形回帰モデルと異常検知*
 6.6.1 最大事後確率解としてのリッジ回帰
 6.6.2 パラメターσ2の決定
 6.6.3 異常度の定義
章末問題

7. 時系列データの異常検知
7.1 近傍法による異常部位検出
 7.1.1 スライド窓による時系列データの変換
 7.1.2 異常部位検出問題
 7.1.3 Rでの実行例
7.2 特異スペクトル変換法
 7.2.1 特徴的なパターンの算出
 7.2.2 変化度の定義
 7.2.3 Rでの実行例
7.3 自己回帰モデルによる異常検知
 7.3.1 1変数の自己回帰モデル
 7.3.2 ベクトル自己回帰モデル
 7.3.3 次数rの決定
 7.3.4 異常度の定義とRでの実行例
7.4 状態空間モデルによる異常検知*
 7.4.1 線形状態空間モデル
 7.4.2 部分空間同定法:状態系列の推定
 7.4.3 部分空間同定法:未知パラメターA,C,Q,Rの推定
 7.4.4 状態系列の逐次推定法:カルマンフィルタ
 7.4.5 状態空間モデルを用いた異常検知
章末問題

8. よくある悩みとその対処法
8.1 数式を使いたくありません
8.2 モデルが変わってゆくのですが
8.3 変数の値の範囲が変で困っているのですが
 8.3.1 ロジスティック変換
 8.3.2 ボックス=コックス変換
8.4 正規分布の結果がおかしいのですが
8.5 データがベクトルになっていないのですが
8.6 異常の原因を診断したいのですが
8.7 分類問題にしてはいけませんか
8.8 さらに発展的な知識を得るために

付録
A.1 有用なRのパッケージ
A.2 確率変数の変換
 A.2.1 確率密度関数と周辺化
 A.2.2 条件付き確率と独立性
 A.2.3 逆変換が一意に定義できる場合の変換
 A.2.4 M変数から1変数への変換
A.3 有用な行列公式
 A.3.1 ブロック行列と逆行列
 A.3.2 行列式
 A.3.3 行列の微分
A.4 正規分布の性質のまとめ
 A.4.1 正規分布の確率密度関数の導出
 A.4.2 単位球の表面積
 A.4.3 正規変数の和の分布
 A.4.4 多変数正規分布の分割公式
 A.4.5 多変数正規分布とベイズ公式
A.5 カーネル密度推定における平均積分二乗誤差の漸近形
A.6 等式制約付きの非線形最適化

引用・参考文献
索引
Rコマンド索引

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

まろにしも

10
予想通り、私には難しかったが、統計検定準1級で勉強していた手法の「お気持ち」や「流れ」についての理解が深まる部分もあり、また、固有値やスペクトル分解など、線形代数のエッセンス部分の理解が弱いことを再認識出来たのは、良かった。2023/10/21

むらてつ

1
内容が結構難しかったのでナナメ読み.2022/05/02

はやと

1
非常にわかりやすかった。 さまざまなパターンのデータに対応する異常検知の手法がまとめられていたので、教科書代わりに使いたい。 個人的にpythonで書きたいので、Rのコードを書き換えるか先人の物を探す。2020/03/16

jackkitte

1
機械学習の観点から異常検知を扱ったまとまった書籍が現状こちらと講談社MLPシリーズの「異常検知と変化検知」だけなので、始めにこれから読んでみた。入門と書いてある割には数学・統計学の知識が分かってないと、かなり難しい内容となっている。しかし、異常検知や外れ値検出などの基本的な手法が網羅されており、尚且つ、Rでの実装方法も書かれており、解説も丁寧な内容なので、異常検知界隈をしる書籍としてはかなり良書なのではないかと思う。2017/07/20

Kenny

1
最尤推定とは「ある観測結果が与えられたとき、尤度とよばれる量が最大となるようにパラメターを決める」という手法で、確率分布の引数に観測結果を代入したものが尤度である。「データ洗浄」、「外れ値検出」、「クラスタリング」、「正準相関分布」、「異常部位検出」、「変化点検知」、「主成分分析」などの解説と数式的な根拠が記載されている。それぞれの手法をどのようにして、プログラムやビジネス、生活習慣に反映させて行くかが重要であることに変わりはないため、各手法の活用例や、長所や短所を把握するため再読を実施したい。2016/06/27

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/9668800
  • ご注意事項