出版社内容情報
◆◆機械学習の成否を分かつ「前処理」◆◆
◆◆実務に直結するテクニックを習得◆◆
データ分析技術の中心には、分析アルゴリズムやモデリング手法があります。
しかし実務の現場では、むしろ「前処理」の重要性に直面します。
その方法は「分析目標」と「データ形式」によって異なり、
そこからどのように特徴量を作り出すかで、機械学習の成否が左右されます。
本書では、構造化データ、画像データ、時系列データ、自然言語について、
機械学習における前処理の手順を紹介。
演習問題を経て、Pythonによる実装までを体験します。
データ分析のフレームワークCRISP-DMに沿って実装を進めるので、
実務に近い形で前処理のテクニックが身に付きます。
◆◆本書の主な構成◆◆
第1章 データ分析・活用を始めるために
1 データドリブンな時代へ
2 データ分析プロジェクトに必要な要素
3 データ分析人材のスキル
第2章 データ分析のプロセスと環境
1 ビジネス理解
2 データ理解
3 データ準備
4 モデル作成
5 評価
6 展開・共有
7 データ分析環境の選択
8 Jupyter Notebook の使い方
第3章 構造化データの前処理
1 データ理解
2 データ準備
3 モデル作成
4 再びデータ準備へ
5 再びモデル作成へ
練習問題の解答
第4章 構造化データの前処理(2)
1 顧客の特性を知る
2 顧客のグループ化
3 潜在ニーズの抽出
第5章 画像データの前処理
1 データ理解
2 機械学習のためのデータ準備
3 深層学習のためのデータ準備
練習問題の解答
第6章 時系列データの前処理
1 データ理解
2 データ準備
3 教師データの作成
練習問題の解答
第7章 自然言語データの前処理
1 データ理解
2 機械学習のためのデータ準備
3 深層学習のためのデータ準備
4 トピック抽出のためのデータ準備
付録
1 JupyterLab ローカル環境の構築
2 画像認識モデルの作成
3 記事分類モデルの作成
4 記事トピックの抽出
5 様々な可視化ツール
内容説明
データ分析技術の中心には、分析アルゴリズムやモデリング手法があります。しかし実務の現場では、むしろ「前処理」の重要性に直面します。その方法は「分析目標」と「データ形式」によって異なり、そこからどのように特徴量を作り出すかで、機械学習の成否が左右されます。本書では「予測」を分析目標とし、構造化データ、画像データ、時系列データ、自然言語について、機械学習における前処理の手順を紹介。演習問題を経て、Pythonによる実装までを体験します。データ分析のフレームワークCRISP‐DMに沿って実装を進めるので、実務に近い形で前処理のテクニックが身に付きます。
目次
第1章 データ分析・活用を始めるために
第2章 データ分析のプロセスと環境
第3章 構造化データの前処理
第4章 構造化データの前処理(2)
第5章 画像データの前処理
第6章 時系列データの前処理
第7章 自然言語データの前処理
付録 Appendix
著者等紹介
足立悠[アダチハルカ]
BULB株式会社所属のデータサイエンティスト。過去にメーカーのSEやデータサイエンティスト、ITベンダーのデータアナリスト等を経て現職。数々のデータ分析プロジェクトのほか、実務者教育にも従事。個人的な活動として、記事や書籍の執筆、セミナー講師なども行っている(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
ユータス
TKNR