内容説明
数学やプログラミングの予備知識が全くないことを前提に,現実世界のデータを分析してさまざまな疑問に答える手法を平易な解説で学ぶ.不可欠な概念や手法にフォーカスし,統計分析ソフトRにおける最小限のツールを駆使することで,誰もが着実にデータサイエンスの面白さを体感できる.初めての一冊にうってつけの入門書.※この電子書籍は「固定レイアウト型」で作成されており,タブレットなど大きなディスプレイを備えた端末で読むことに適しています.また,文字だけを拡大すること,文字列のハイライト,検索,辞書の参照,引用などの機能は使用できません.
目次
序文
1 イントロダクション
1.1 本書の概観
1.2 各章の概要
1.3 本書の使い方
1.4 なぜデータ分析を学ぶのか?
1.4.1 コードの学習
1.5 準備
(1) ファイルのダウンロードと保存
(2) RとRStudioのダウンロードとインストール
(3) RStudioを使いこなす
1.6 Rの紹介
1.6.1 Rで計算をする
1.6.2 Rでオブジェクトを作成する
1.6.3 Rで関数を使ってみよう
1.7 データを読み込んで理解する
(1) 作業ディレクトリを設定する
(2) データセットを読み込む
(3) データを理解する
(4) 収録された変数の種類を明らかにする
(5) 観察数を明らかにする
1.8 平均値を計算し,解釈する
1.8.1 データフレーム内の変数にアクセスする
1.8.2 平均値
1.9 まとめ
2 無作為化実験による因果効果の推定
2.1 STARプロジェクト
2.2 処置変数と結果変数
2.2.1 処置変数
2.2.2 結果変数
2.3 個別因果効果
2.4 平均因果効果
2.4.1 無作為化実験と平均の差推定量
2.5 少人数学級は生徒の成績を向上させるか?
2.5.1 Rの関係演算子
2.5.2 新しい変数の作成
2.5.3 変数の部分集合化
2.6 まとめ
3 社会調査研究による母集団の特徴の推論
3.1 英国におけるEU国民投票について
3.2 社会調査研究
3.2.1 無作為抽出
3.2.2 潜在的な問題点
3.3 Brexitへの支持の測定
3.3.1 国民投票の結果を予測する
3.3.2 度数表
3.3.3 比率表
3.4 Brexitを支持したのは誰?
3.4.1 欠損データの処理
3.4.2 二元度数表
3.4.3 二元比率表
3.4.4 ヒストグラム
3.4.5 密度ヒストグラム
3.4.6 記述統計
3.5 英国全体における教育と離脱派票との関係
3.5.1 散布図
3.5.2 相関
3.6 まとめ
4 線形回帰を用いた結果の予測
4.1 GDPと夜間光放射量
4.2 予測変数,観察結果と予測結果,および予測誤差
4.3 2つの変数の関係を直線で要約する
4.3.1 線形回帰モデル
4.3.2 切片の係数
4.3.3 傾きの係数
4.3.4 最小2乗法
4.4 過去のGDPを利用してGDPを予測する方法
4.4.1 GDPと過去のGDPの関係
4.4.2 自然対数変換
4.5 夜間光放射量を用いたGDP成長の予測
4.6 決定係数R を用いたモデルのデータ適合度の測定
4.6.1 本章の3つの予測モデルはデータにどの程度適合するのでしょうか?
4.7 まとめ
4.8 付録:対数‐対数線形モデルの傾きの解釈
5 観察データによる因果効果の推定
5.1 ロシア国営テレビによる2014年ウクライナ情勢の報道
5.2 観察データによる因果効果推定における問題点
5.2.1 交絡変数
5.2.2 なぜ交絡因子が問題なのか?
5.2.3 無作為化実験における交絡因子
5.3 ウクライナ人の投票行動に及ぼすロシア系テレビ放送の影響
5.3.1 平均の差推定量を計算するための単回帰モデルの使用
5.3.2 重回帰モデルを用いた交絡因子の統制
5.4 ロシア系テレビ放送がウクライナの選挙結果に与えた影響
5.4.1 平均の差推定量を計算するための単回帰モデルの使用
5.4.2 重回帰モデルを用いた交絡因子の統制
5.5 内的妥当性と外的妥当性
5.5.1 無作為化実験と観察研究
5.5.2 無作為化の役割
5.5.3 本章の2つの因果分析はどの程度優れているのか?
5.5.4 第2章の因果分析はどの程度優れていたのでしょうか?
5.5.5 決定係数R
5.6 まとめ
6 確率
6.1 確率とは何か?
6.2 確率の公理
6.3 事象,確率変数,および確率分布
6.4 確率分布
6.4.1 ベルヌーイ分布
6.4.2 正規分布
6.4.3 標準正規分布
6.4.4 おさらい
6.5 母集団のパラメーターと標本統計量の比較
6.5.1 大数の法則
6.5.2 中心極限定理
6.5.3 二値確率変数による例
6.5.4 標本平均の標本分布
6.6 まとめ
6.7 付録:forループ
7 不確実性の数値化
7.1 推定量と標本分布
7.2 信頼区間
7.2.1 標本平均の信頼区間
7.2.2 平均の差推定量の信頼区間
7.2.3 予測結果の信頼区間
7.3 仮説検定
7.3.1 平均の差推定量を用いた仮説検定
7.3.2 推定された回帰係数を用いた仮説検定
7.4 統計的有意性と科学的有意性
7.5 まとめ
訳者あとがき
事項索引
数学的表記索引
RとRStudio索引
-
- 電子書籍
- エンタメの未来2031
-
- 電子書籍
- 再会は甘美な罪〈予期せぬウエディング・…
-
- 電子書籍
- 氷の上のプリンセス ジュニア編3.5 …
-
- 電子書籍
- あたし、キスした。(1)
-
- 電子書籍
- 兵隊三日捕虜三年 新人物文庫