出版社内容情報
「評価指標でXXXという最高のスコアが出た!」と喜び勇んで、機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが、ビジネス上のKPIと相関が高い評価指標を選んでいなかったために、KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして、特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが、KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは、データサイエンティストが費やした工数がすべて水の泡となってしまいます。----------(はじめにより)----------
このような状況が起きてしまう背景にはさまざまな原因が考えられますが、あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。
機械学習モデルの”良し悪し”を決めるときには、評価指標(Evaluation Metrics)を必要とします。本質的に評価指標の設計方法は自由であり、ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから、ドメインに特化した数値まで、あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また、どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。
本書はこれらの疑問に答えるため、機械学習の良し悪しを決める評価指標を軸に、解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか、その原理を解説していきます。この原理が普遍的なものであれば、ビジネスがどんなものであっても応用できると考えることができます。
回帰、分類で使用するスタンダードな評価指標についても、基本から丁寧に解説します。本書を読むことで、どのようなケースでどの評価指標を選ぶべきかがわかり、評価指標の読み間違いを避けることができます。
内容説明
「無自覚なモデル改善」ほど無駄なものはない。ビジネスの問題をいかにして機械学習の問題に落とし込むのか。データサイエンスに閉じた問題を解くだけのデータサイエンティストは生き残れない。
目次
1章 評価指標とKPI(機械学習と評価指標;機械学習と最適化計算 ほか)
2章 回帰の評価指標(回帰とは;データセットと回帰モデルの準備 ほか)
3章 二値分類における評価指標(二値分類と評価指標;データセット ほか)
4章 多クラス分類の評価指標(多クラス分類とは;データセット ほか)
付録 ビジネス構造の数理モデリング
著者等紹介
高柳慎一[タカヤギシンイチ]
2020年総合研究大学院大学複合科学研究科博士課程修了、博士(統計科学)
長田怜士[ナガタリョウジ]
大阪電気通信大学情報通信工学部情報工学科卒業(学士)。新卒でセキュリティエンジニアをしていたが、機械学習がしたい欲求に抗えず株式会社ALBERTに転職し、機械学習プロジェクトの経験を積む。その後スタートアップ2社を渡り歩き、現職の株式会社ユーザベースに入社。現在はユーザベースのSaaS事業にて、機械学習を用いた機能開発・運用を主に担当(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
ぶう
shin_ash
yyhhyy
icon
tossy
-
- 和書
- AI歴史学