内容説明
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
データ分析の現場にあって入門書にないもの――それは、「汚いデータ」(ダーティデータ)です。本書は、データ分析の現場では、どんなデータに出会い、どのような問題が生じ、どう対応すればよいのかというノウハウを解説します。事前の加工(視覚化)から機械学習、最適化問題まで、100本ノックをこなして、ビジネス現場で即戦力になれる「応用力」を身につけましょう! Pandas、Numpy、Matplotlibなど10個のライブラリを練習します。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
エリナ松岡
10
ちょっとコード変じゃないかな、という気もしないでもないですが、こういう業務を擬似体験できる本が欲しかった。内容も結構バラエティに富んでおり、飽きることもなかったです。▼続編もあるのでそちらも読む予定ですが、もっとこの系統の本が出てくれるとありがたいです。2021/04/16
PenguinTrainer
9
kaggleのようなデータ分析するの必要な前処理や解析の手法が書かれた本。 kaggleの他人の解説が読めればこの本を読む必要は無いと思うが、日本語で丁寧に書かれているので"多少勉強する気があったけど英語が......"という人にはちょうど良いと感じた。2022/04/28
Taizo
9
ぶっちゃけノックの質がいいわけではない、クソ遅くなるコードの書き方をしたりしているし。だがノックとはそういうものだ。綺麗に処理しようが汚かろうがアウトが取れればそれでいい。というかその辺も「実践」的である。実務でもコードはどうでもいいから結果を出せと言うときがよくあるから。実行が遅くてもコードを書く時間が短ければいいのだ。 コンテンツも表形式・最適化・自然言語・画像と非常に実践的。DLがないのもいい。そんな打球はそうそう飛んでこない。泥にまみれて白球を追えばいつしか上手くなる、そういうもんだ。2020/12/31
えんど
8
web企業ならここまでデータ汚いことはドスタートアップくらいかな。中間テーブルで加工してるのでもっとらくに前処理はできる。泥臭くていい練習になった2020/11/14
くとほん
7
データクレンジングから機械学習までを何パターンか繰り返す本。PandasとScikitに馴染むためにひたすらコーディングするためのドリルとして有用だったと思う。比重的にはPandasの方が大きいので、既にゴリゴリに使えている方にしたら物足りなさがあるだろう。Pythonに一通り慣れて、機械学習の雰囲気がなんとなくわかった段階で手に取れば楽しみながら取り組める一冊だと思う。2019/11/19