WEB+DB PRESS plusシリーズ
ビッグデータを支える技術―刻々とデータが脈打つ自動化の世界

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 283p/高さ 22cm
  • 商品コード 9784774192253
  • NDC分類 007.6
  • Cコード C3055

出版社内容情報

ビッグデータの基盤に焦点を当てた解説書。ますます増えていくデータ。AIやビジネス分析をはじめ幅広い分野で欠かせない、ビッグデータ技術は多彩な要素技術の集合体です。
 本書では「全体像を捉える」ことに主眼を置き、基本事項、可視化を題材とした継続的なデータ収集/蓄積/集計、対話的/自動的処理、データパイプライン、ワークフロー管理に至るまで、何が/なぜ必要かを織り込みながら厳選解説。増え続けるデータから価値ある情報を見つけたい/高速かつ効率的に扱いたいエンジニアの方々のために、データ処理の基本と大規模分散処理の今を凝縮しました。

内容説明

1台のラップトップで学べる。ビッグデータの技術基礎。規模を超えて、これからのシステム開発に欠かせないデータ基盤を整える。

目次

第1章 ビッグデータの基礎知識
第2章 ビッグデータの探索
第3章 ビッグデータの分散処理
第4章 ビッグデータの蓄積
第5章 ビッグデータのパイプライン
第6章 ビッグデータ分析基盤の構築

著者等紹介

西田圭介[ニシダケイスケ]
1976年兵庫生まれ。トレジャーデータ(株)に所属(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

vinlandmbit

24
これは良かった。pythonを使いつつ、実際にtwitter API使ってmongoDBに入れたり、Spark動かしたりと独自実践も掲載されてて理解しっかり深まります。2019/05/21

roughfractus02

6
データを集めて集計するには、蓄積と加工(検索)の2つのプロセスを要し、蓄積量と速度が技術開発の焦点となる。本書では、このデータパイプラインを、リレーショナルデータベース管理でなく柔軟化したNoSQLと分散処理技術Hadoopを中心に、探索、分散処理、蓄積、パイプラインの順で概観でき、最後にその実践編も用意される(2017刊)。AIに関する機械学習等の説明よりも、データ分析と構造に焦点を当てており、この複雑な領域を図表を多用して体系的に説明しているので理解しやすい。データマート構築での非正規化は参考になる。2018/06/06

ますみ

3
読み返した。インメモリDBとかHTAPとかストリーム処理エンジン周りは触れてないなぁとか思った。Hive周りはまだ苦手。多次元化モデル(ディメンジョン・メジャー)を再認識できたのは思わぬ収穫で、データマート内にサマリーテーブルを作る際に定義済みの言葉を使え考えやすくなった。2018/08/15

Iron Patriot

3
ビッグデータを扱う上での、データベース周辺のデータの流れのイラストが多くて、分かりやすい。イラストは活用できそう。 Pythonのプログラム例も紹介。 2018/01/16

toiwata

3
圧倒的に読みやすい。いわゆる「ビックデータ」について概略を知るのはまずこの本からという感じ。2017/11/15

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/12233979
  • ご注意事項

最近チェックした商品