Kaggleコンペティション チャレンジブック

個数:1
紙書籍版価格
¥3,828
  • 電子書籍
  • Reader

Kaggleコンペティション チャレンジブック

  • ISBN:9784839968939

ファイル: /

内容説明

Kaggleのコンペティションによって機械学習を学ぼうとしている読者のためのKaggle入門書です。Pythonと機械学習についての基礎的な知識を有している読者が、Kaggleから機械学習を学べるようサポートすることを目標としています。

過去のKaggleのコンペティションから、機械学習モデルの正確度を高める実質的な方法について重点的に扱っていきます。多様なデータに接しモデリングを経験できるよう、表形式データを扱うコンペティションを2つ、音声データ/イメージデータを扱うコンペティションを1つずつ、計4つのKaggleコンペティションを選択しました。

表形式データ(テーブルデータ)を扱うコンペティションでは、データの前処理、特徴量エンジニアリングの内容に重点をおき、学習モデルはXGBoost、LightGBMのようなツリーを基盤としたモデルを使用しました。
音声データとイメージデータを扱うコンペティションでは、ディープラーニングモデルの学習に重点を置き、CNNのディープラーニングモデルが使われます。

それぞれの章でコンペティション別に、大会の紹介、主催側の動機、評価の基準、主要なアプローチ、データを準備する方法、データ分析、勝者の智恵に至るまで具体的に検討します。そして過去のコンペティションで使用されたPythonコードを実行することで、探索的データ分析を進め、機械学習モデルを学び、最終的にKaggleに結果をアップロードして性能が向上したことを体験できます。

筆者は本書を通して、読者が機械学習の問題を解くために悩んでほしいと思っています。「次の段階では何をしなければならないのか?」「機械学習モデルの性能を高めるためには何をすればよいのか?」「現在の機械学習パイプラインのどこに問題があるのか?」などの質問を自分自身に投げかけ、悩むことをおすすめします。たっぷりと悩みながらこの本を読みコンペティションに参加したならば、非常に多くのことを得るはずです。

筆者がKaggleを通して多くのことを学んだように、読者の皆さんもぜひKaggleを通して機械学習に没頭してほしいと思います。