出版社内容情報
いま必要とされるデータサイエンスの素養がしっかり身につく一冊。
さまざまな場面で入手できるデータを価値に転換することが、データサイエンスの目的です。データサイエンスという言葉は、ビジネスやアカデミーを問わず、いまや多くの場面で聞かれるようになり、それだけ重要性が高まっている概念といえます。本書は、データサイエンスを理解し実践したいと考えている方に必要とされる、データサイエンスの素養がしっかり学べる一冊です。
データサイエンスは、統計的、計算的、人間的という3つの視点の有機的結合という一面があるといわれます。本書では、データ分析に必要な統計学をはじめとする数学を丁寧にフォローし、統計的な考え方が自然に身につくよう配慮しています。また、データを適切に処理するための計算法は、プログラミング言語としてRを用いつつ、近年注目度の高い機械学習を含む具体例を通して納得しながら理解できる構成です。さらに、データの前処理から分析結果のプレゼンテーションまでの過程には人間が関わるという観点で、データを取り扱ううえで心がけるべきことにも言及します。
目次
イントロダクション
Rの基礎
データの記述・可視化
関連と因果、データ分析における注意事項
データ倫理
確率
確率分布
標本分布と中心極限定理
点推定・区間推定・仮説検定・p値
機械学習の基礎
回帰モデル
分類
ベイズ線型モデル
決定木とアンサンブル学習
スパース学習
著者等紹介
田栗正隆[タグリマサタカ]
2010年東京大学大学院医学系研究科博士課程修了。博士(保健学)。現在、東京医科大学医学部医療データサイエンス分野主任教授
汪金芳[ワンジンファン]
1994年千葉大学大学院自然科学研究科博士後期課程単位取得退学。統計数理研究所領域統計研究系助手。現在、横浜市立大学データサイエンス学部教授(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。