内容説明
本書は,ソーシャルビッグデータの基本概念そしてデータマイニングや機械学習の基本技術の理解から,具体的にコンピュータ環境の構築と分析ツールの実装方法を解説し,データの収集・可視化・分析までを自学自習できるようにした。
目次
第I部 基礎編
1. ビッグデータ
1.1 ビッグデータの特徴
1.2 実世界データ
1.3 オープンデータ
1.4 ソーシャルデータ
1.5 ソーシャルビッグデータ
1.5.1 実世界データとソーシャルデータのインタラクション
1.5.2 ユニバーサルキー
1.6 イシカワ・コンセプト,そしてジオソーシャルビッグ
1.6.1 ソーシャルビッグデータ利用の一般的な流れ
1.6.2 ソーシャルビッグデータの4番目のv
1.7 ソーシャルビッグデータ応用(ケーススタディ)
1.7.1 ケース1―観光応用:掘り出し物スポット発見(ソーシャルデータ×印象評価)
1.7.2 ケース2―観光応用:トピックの地域的影響(異種ソーシャルデータ×クラスタリング&グラフモデル)
1.7.3 ケース3―観光応用:観光資源名の意味(ソーシャルデータ&オープンデータ×Word2Vec)
1.7.4 ケース4―観光応用:見頃推定(ソーシャルデータ&オープンデータ×時系列分析)
1.7.5 ケース5―観光応用:FreeWi-Fiスポット設置候補(異種ソーシャルデータ×統合分析)
1.7.6 ケース6―防災応用:危険避難路発見(ソーシャルデータ&オープンデータ×グラフモデル)
1.7.7 ケース7―科学応用:中央丘クレーターの発見(オープンデータ(実世界データ)×ディープラーニング)
1.8 本書で学んでほしいこと
1.8.1 データサイエンティストとデータエンジニア
1.8.2 データサイエンティスト
2. データマイニング・機械学習の基本技術
2.1 概論
2.2 データマイニングとは
2.2.1 データマイニングの細分化
2.3 データマイニングと周辺分野の関連
2.3.1 データベース
2.3.2 統計解析
2.3.3 機械学習
2.4 データマイニングのプロセス
2.4.1 データの選択
2.4.2 データの前処理
2.4.3 データの変換
2.4.4 パターン,知識の発見
2.4.5 解釈と評価
2.5 クラスタリング
2.5.1 概要
2.5.2 階層的クラスタリング
2.5.3 k-means
2.5.4 DBSCAN
2.6 分類
2.6.1 概要
2.6.2 k近傍法
2.6.3 決定木
2.6.4 SVM
2.6.5 ディープラーニング
2.7 その他の手法
2.7.1 アンサンブル学習
2.7.2 相関ルール
第II部 実践編
3. ソーシャルビッグデータ分析を支えるWeb技術
3.1 フルスタックJavaScript
3.1.1 サーバ上のJavaScript
3.1.2 データベース上のJavaScript
3.1.3 本書で実装するシステムの構成
3.2 環境構築
3.2.1 Node.jsのインストール
3.2.2 MongoDBのインストール
3.2.3 実装ディレクトリの準備
3.3 Web3層アーキテクチャの実装
3.3.1 Webサーバ
3.3.2 WebSocket
3.3.3 WebSocketによるチャットプログラム
3.3.4 JavaScript object notation(JSON)
3.3.5 GeoJSON
3.3.6 MongoDBの利用
3.3.7 Node.jsからMongoDBへのアクセス
3.3.8 非同期処理環境における処理フローの記述
3.3.9 MongoDBとWebSocketによるチャットプログラム
4. データを集める
4.1 ソーシャルビッグデータを知る
4.2 ソーシャルビッグデータの収集
4.2.1 検索によるTwitterデータの収集
4.2.2 新着監視によるTwitterデータの収集
4.2.3 検索によるFlickrデータの収集
4.2.4 新着監視によるFlickrデータの収集
4.2.5 DBpediaを用いたWikipediaデータの収集
4.3 ジオソーシャルビッグデータの収集
4.3.1 ジオタグ付きツイートの収集
4.3.2 ジオタグ付き写真の収集
4.3.3 OpenStreetMapへの問い合わせ
4.4 クローラの実装と運用
4.4.1 クローラ機能のパッケージ化
4.4.2 さらに高度な実装のために
5. データを可視化する
5.1 可視化ライブラリのインストール
5.1.1 チャート描画
5.1.2 カラーパレット
5.2 ソーシャルデータ分析可視化環境の準備
5.2.1 プログラムのインストール
5.2.2 分析対象ソーシャルデータのクロール
5.3 散布図
5.4 ワードクラウド
5.5 地図描画
5.6 ヒートマップ
6. データを分析する
6.1 準備
6.2 線形回帰
6.3 k-means
6.4 DBSCAN
6.5 機械学習
6.6 TF-IDF
6.7 おわりに
引用・参考文献
索引
-
- 電子書籍
- 殺し愛【分冊版】 69 MFコミックス…
-
- 電子書籍
- 婆ボケはじめ、犬を飼う(分冊版) 【第…
-
- 電子書籍
- 姉系Petit Comic 2017年…
-
- 電子書籍
- 嫁エルフ。 ~前世と来世の幼なじみから…
-
- 電子書籍
- ふらいんぐうぃっち(1)