内容説明
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
●Kaggleは楽しい!
Kaggleは誰でも気軽に参加できるデータ分析の競技コンペです。
コンペで試した技を、実務に応用する――そのシナジーにより、みるみる実力が付きます。
Kaggleマスターの著者自身がそうして得たノウハウを、惜しげもなく本書では公開します。
しかし、本書を通じてお伝えしたいのは、何よりKaggleのワクワク感です!
目次
第I部●分析実務とKaggle
1 実務に必要なスキルとは
2 Kaggleの概要
3 Kaggleを学習ツールに
第II部●機械学習の進め方
4 ベースライン作成
5 特徴量エンジニアリング
6 モデルチューニング
第III部●実践例
7 2値分類のコンペ
8 回帰問題のコンペ
9 データサイエンティストの未来
感想・レビュー
※以下の感想・レビューは、株式会社ドワンゴの提供する「読書メーター」によるものです。
nbhd
12
ここ最近、何をしているかといえば、データ分析の国際コンペであるKaggleで「宇宙船タイタニック号の生存者予測」ばかりしている。この本は、Kaggleの手練手管をていねいに解説していて、たいへん勉強になった。バリデーション設計というやつのプログラミングコードが長くてややこしいので、今後はそこらへんを習得したいなー。2023/12/13
kaida6213
5
全体的に流れが掴める良書。さりとて述べられてもいるが、上位入にはデータごとの一工夫が必要。2025/02/16
日輪
3
特徴量生成。数値の単変数:対数変換(桁が大きい場合)、累乗・指数関数・逆数、離散化(binに変換)、欠損で0/1変換(isnull()*1で1を立てる)。カテゴリ変数の単変数:One Hot Encoding、Count Encoding(出現回数)、Label Encoding、欠損で0/1変換。2変数組合せ:数値と数値(四則演算)、カテゴリとカテゴリ(crosstab等での集計値、条件式等での0/1変換)、数値とカテゴリ(groupby等での集約値)。時系列:ラグ特徴量、ウィンドウ特徴量、累積特徴量。2024/01/14
mopinfish
1
ベースラインの作成から特長料の抽出、パラメータチューニングまで一度コードを一通り作った後に以下にして試行錯誤していくかの流れが丁寧にまとめられていて読みやすかった。後半のBaseballPlayerの時系列データを使った問題は写経しながら取り組んでみたい。2023/07/22
うんこ
0
7章と8章の途中までは実際にコードを実行しながら読んだ。Kaggleの取り組み方のイメージを掴むことができた。2023/07/02
-
- 電子書籍
- 九条愛子に、凄惨なる死を【タテヨミ】 …




