出版社内容情報
データサイエンスの現場において、その業務は「前処理」と呼ばれるデータの整形に多くの時間を費やすと言われています。「前処理」を効率よくこなすことで、予測モデルの構築やデータモデリングといった本来のデータサイエンス業務に時間を割くことができるわけです。本書はデータサイエンスに取り組む上で欠かせない「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。ほとんどの問題についてR、Python、SQLを用いた実装方法を紹介しますので、複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。
目次
1 入門前処理(前処理とは)
2 データ構造を対象とした前処理(抽出;集約;結合;分割;生成;展開)
3 データ内容を対象とした前処理(数値型;カテゴリ型;日時型;文字型;位置情報型)
4 実践前処理(演習問題)
著者等紹介
本橋智光[モトハシトモミツ]
システム開発会社の研究員、Web系企業のデータサイエンティストを経て、デジタル医療スタートアップのサスメド株式会社のCTO。株式会社ホクソエムにも所属。量子アニーリングコンピュータの検証に個人事業主として従事している。製造業、小売業、金融業、運輸業、レジャー業、Webなど多様な業種のデータ分析経験を持つ。KDD CUP 2015 2位(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。