内容説明
Kaggleで技術や知見を獲得!コンペで躍進する力を養おう。本書では、Kaggleにおいて技術や知識がどのように展開/活用されてきたかを詳しく見ていきます。実際に使われた手法は、実践に役立つスキルであり、別のコンペティションにも適用可能です。この本では、過去の4つのコンペティションを取り上げ、以下の観点で解説します―「各コンペティションの背景」「ディスカッションの活用」「ノートブックの再利用」「特徴量エンジニアリングのアプローチ」「さまざまなモデルの訓練」など。実際の事例を説明しており、Kaggleコンペティションで成功するためのヒントとなるはずです。さらに、本書で取り上げたように、Kaggleのリソースを使った学習を重ねることで、データ分析能力を大幅に向上させることができるでしょう。
目次
第1章 最も名高いテーブルコンペティション―Porto Seguro’s Safe Driver Prediction(コンペティションとデータを理解する;評価指標を理解する ほか)
第2章 Makridakisコンペティション―正解率と不確実性に関するKaggleのM5(コンペティションとデータを理解する;評価指標を理解する ほか)
第3章 画像分類コンペティション―Cassava Leaf Disease Classification(データと指標を理解する;ベースラインモデルを構築する;上位のソリューションから学ぶ;完全なソリューション;本章のまとめ)
第4章 自然言語処理コンペティション―Google QUEST Q&A Labeling(ベースラインソリューション;上位のソリューションから学ぶ;本章のまとめ)
著者等紹介
バナシェヴィッチ,コンラッド[バナシェヴィッチ,コンラッド] [Banachewicz,Konrad]
アムステルダム自由大学にて統計学の博士号を取得。その後、さまざまな金融機関でデータ分析の問題に取り組む。電子商取引会社eBayのリードデータサイエンティストを経て、現在はデータサイエンティストとしてオンライン広告会社のAdevintaに勤務。Kaggleの称号としてNotebooksとDiscussionのGrandmaster、CompetitionsとDatasetsのMasterを取得。過去の最高ランクはDiscussionで7位
マサロン,ルカ[マサロン,ルカ] [Massaron,Luca]
10年以上の経験を有するデータサイエンティスト。現在、オンライン銀行illimity Bankのデータサイエンス&モデリング・シニア・エキスパート。機械学習のGoogleデベロッパーエキスパートであり、AIやアルゴリズムなどに関する多数の書籍の共著者でもある。Kaggleの称号としてDiscussionのGrandmaster、CompetitionsとNotebooksのMasterを取得。過去の最高ランクはCompetitionsで7位、Discussionで8位(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。