出版社内容情報
機械学習や人工知能の性能を決める特徴量作成・変換/選択について詳述した書籍!
本書は、機械学習を行うエンジニアが知るべき特徴量抽出の基本から応用、最新のテーマまでを網羅した書籍です。内容としてはそれほど難しくないため、機械学習を学んでいる人が特徴量エンジニアリングについて学びはじめる書籍として最適です。
内容説明
本書は、機械学習モデルの性能を向上させるために、データから良い特徴量を作る特徴量エンジニアリングについて解説します。前半では初学者に向けて、数値、テキスト、カテゴリ変数の基本的な取り扱い方を説明し、後半では特徴量ハッシング、ビンカウンティング、PCAによるデータの圧縮、さらに非線形特徴量とモデルスタッキング、画像特徴量抽出と深層学習による自動特徴学習などの高度なテーマを扱います。特徴量エンジニアリングの原理について直感的な理解が得られるように図や例を豊富に使い、またPythonコードによる実行例を数多くあげて解説しており、実際の業務に適用するための具体的な知識が得られます。特徴量エンジニアリングを使いこなし、機械学習モデルの性能を最大限に引き出したいエンジニア必携の一冊です。Kaggle GrandmasterのKohei Ozaki(@smly)氏による「日本語版に寄せて」を収録しています。
目次
1章 機械学習パイプライン
2章 数値データの取り扱い
3章 テキストデータの取り扱い
4章 特徴量スケーリングによる効果:Bag‐of‐WordsのTF‐IDFによる重み付け
5章 カテゴリ変数の取り扱い
6章 次元削減:膨大なデータをPCAで圧縮
7章 非線形特徴量の生成:κ‐meansを使ったスタッキング
8章 特徴量作成の自動化:画像特徴量の抽出と深層学習
9章 バック・トゥ・ザ・「フィーチャー」:学術論文レコメンドアルゴリズムの構築
付録A 線形モデリングと線形代数の基礎
著者等紹介
チャン,アリス[チャン,アリス] [Zheng,Alice]
機械学習、スパニングアルゴリズム、プラットフォーム開発の技術リーダー。現在、Amazon Advertisingにおいてサイエンス研究マネージャーをしている。それ以前は、GraphLab/Dato/Turiでのツールキット開発とユーザー教育に携わり、Microsoft Researchでは機械学習の研究者だった。UC Berkeley大学で電気工学およびコンピュータサイエンスの博士号、また数学の学士号を取得している
カサリ,アマンダ[カサリ,アマンダ] [Casari,Amanda]
次世代の技術を探求し、その影響を実証しているエンジニア。Concur Labsの上級プロダクトマネージャーおよびデータサイエンティストであり、SAP ConcurにおけるConcur Labs AI Researchチームの共同設立者でもある。過去16年間にわたり、データサイエンス、機械学習、ロボティクスなど幅広いエンジニアリング分野に携わってきた。米海軍アカデミーで制御システム工学の学士号と、Vermont大学の電気工学の修士号を取得している(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
shin_ash
_
ONE_shoT_
Zooshima
g_h_
-
- 和書
- 閃光 角川文庫