データサイエンティストの基礎知識―挑戦するITエンジニアのために

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 318p/高さ 21cm
  • 商品コード 9784897979533
  • NDC分類 336.17
  • Cコード C3055

出版社内容情報

◆データ分析の仕事をR言語で疑似体験◆

本書では主にR言語を用い、データ分析の仕事を疑似体験します。
後半ではOSSの「オンライン機械学習フレームワーク」を実際に使って
簡単なレコメンデーションシステムを開発するほか、
Twitter上の拡散ネットワークの可視化等を試みます。
いずれも、第一線の現役データサイエンティスト集団が手引きします。

第1章 分析とは
1-1 ビッグデータ時代の到来
1-2 ビッグデータとは何か?
1-3 BIからBAへ
1-4 データサイエンティスト
1-5 本書を読むにあたって

■第2章 データ分析に必要なスキル
2-1 分析プロジェクトの進め方
2-2 IT領域の技術
2-3 分析領域の技術
2-4 ビジネス領域の知識

■第3章 ケーススタディ 分析編
3-1 四つの分析型
3-2 集計分析型で原因をあぶり出す
3-3 集計分析型のケーススタディ
3-4 発見型で隠れた法則を見つけ出す
3-5 発見型のケーススタディ

■第4章 ケーススタディ 予測編
4-1 What-If型で新しい業務をデザインする
4-2 What-If型のケーススタディ
4-3 プロアクティブ型で先手を打つ
4-4 プロアクティブ型のケーススタディ
4-5 実装上のいくつかの留意点

■第5章 新しい基盤技術~OML~
5-1 ビッグデータ処理技術の二つの方向
5-2 オンライン機械学習ライブラリ「Jubatus」
5-3 Jubatus環境の構築
5-4 RSS feedのオススメ記事分類

■第6章 新しいデータ~SNS~
6-1 SNSデータへの期待と注意点
6-2 Twitterデータの分析
6-3 拡散ネットワークの分析

■付録 Rのインストールと操作の基本
A-1 R言語のインストール手順
A-2 R言語の基本的な使い方
A-3 その他のツールのインストール手順

内容説明

本書では主にR言語を用い、データ分析の仕事を疑似体験します。後半ではOSSの「オンライン機械学習フレームワーク」を実際に使って簡単なレコメンデーションシステムを開発するほか、Twitter上の拡散ネットワークの可視化等を試みます。いずれも、第一線の現役データサイエンティスト集団が手引きします。

目次

第1章 分析とは
第2章 データ分析に必要なスキル
第3章 ケーススタディ 要因分析編
第4章 ケーススタディ 予測編
第5章 新しい基盤技術―OML
第6章 新しいデータ―SNS
付録 Rのインストールと操作の基本

著者等紹介

中川慶一郎[ナカガワケイイチロウ]
NTTデータ数理システム・取締役、博士(工学)。日本OR学会、日本経営工学会などマーケティング・エンジニアリングを中心とした学術研究からビジネス分野のデータ分析、データマイニングについてコンサルティングまで幅広く活動。H11年度より日本OR学会マーケティング・データ解析研究部会などBI、マーケティング・エンジニアリング、データマイニングに関連する5学会研究部会と連携してデータ解析コンペティションを主催

小林佑輔[コバヤシユウスケ]
NTTデータ・技術開発本部主任。NTTデータ入社以来、公共・法人・金融と、分野によらず様々な顧客の分析コンサルティングに従事。分析手法についても、「見える化」から高度分析、システム化に向けた構想整理まで幅広く実践。近年は事業での経験を活かした技術開発に注力。SNSを活用した分析や新規領域への分析導入など、データ分析の新たな可能性の開拓に取り組んでいる(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

Iron Patriot

3
基礎知識とうたいつつも、この内容を理解しておけばデータ分析の中級者ぐらいは到達できるんじゃないか、と思う。それくらい広い範囲を扱っている。2018/03/11

T2C_

2
単純化された実例からすぐに使えそうな形で学べる一冊。4つの分析型として、見える型、効率化型、業務改革型、サービス革新型を挙げている。その実例として小売店の売り上げ低下要因導出、ISPの顧客ロイヤリティ向上プラン策定、スーパーの発注量モデルの作成、生活雑貨ECサイトやRSSのレコメンドシステム構築、Twitterの拡散の仕方の可視化を扱う。手法として回帰分析、統計的検定、協調フィルタリング、OMLを取り上げ、SQL、R、Python、Java、Jubatasなどを用いて満遍なく解説。強い感動と面白さがあった2015/12/14

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/8344490
  • ご注意事項

最近チェックした商品