内容説明
私たちはデータを思った以上に使えていない。欠けたり見落とされたりした「ダークデータ」をどうしたら活用できるか? 豊富な事例とともに、情報戦略と意思決定の武器を実装する!
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
チャー
12
客観的な伝達と評価のためにデータの重要度は増してきているが、本書ではそもそも集めたデータがどんなものかをきちんと理解して使うことの重要性を伝えている。統計的な理解はもちろん重要だが、集められたデータが全てだと思い過度に信用することは危険。集め方や集まり方、得られたデータの特性と意味するところを理解し、データの背景も意識しつつそこにないものの存在を知ることが肝要。十分慎重にしたとしても、素材の選択を謝ると解析から得られる知見があらぬ方向へ進むこともしばしば。p値ハックやベンフォードの法則は新たな気づき。2021/08/08
Meme
11
ダークデータって名前がイケてる。それを分かっていることが、自分に何らかの特別感、これといって無意味な、を与えてくれる。これについて、ダークデータはどう考えてる?ちょっと言ってみたい。口ずさみたくなるネーミングが読む気も起こさせる。2023/10/26
jackbdc
4
ダークデータという新たな視点(視点の裏返し)に独自性はあるが誤解を招きやすい。本書の主張はデータを鵜吞みにするな。目立つデータに引っ張られて間違えるなという普通のこと。目立ちにくいデータの存在(ダークマターと比してダークデータと名付けた)にも留意せよという至極真っ当な主張である。しかし、ダークデータこそが大事みたいな主張をしてしまうとデータリテラシーを外れたトンデモ理論だと受け取られてしまわないか少し心配。データ分析の実務においては色々と制約条件があるのでどこかで妥協が必要となるが、そこがまた難しい。2021/04/29
Tomomi
1
統計に騙されるなあと思っていたので興味深く読んだ。詐欺に利用される話なんか特に。2021/07/04
susunu1
1
ヨーロッパ最大の心的外傷データベースTARN。16万5千のトラウマ症例のうち、14.5万は治療結果までわかっている。それ以外は30日後の生死がわかっていない。14.5万の症例データを分析して、誤った考えが生まれる恐れがある。極端な想定だが、仮に14.5万が治療を受けず、回復しており、他の2万件が2日以内に死亡していたら。治療しないという診断がなされる。しかし、死亡率は10%を超える事実に愕然とすることになる。『欠けているデータ』の一例である。全てのデータが揃っていると思い込むと正しい分析ができないのだ。2021/06/04
-
- 洋書
- Ghostwriter