エンジニアのためのデータ分析基盤入門―データ活用を促進する!プラットフォーム&データ品質の考え方

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ B5判/ページ数 255p/高さ 24cm
  • 商品コード 9784297127244
  • NDC分類 007.6
  • Cコード C3055

出版社内容情報

システムとデータの両面にスポットを当て、データ分析基盤の整備/運用/活用の指針をまとめた入門書。
データ分析の中心にある「データ分析基盤」を取り巻く環境は、大きく変わりました。機械学習/ディープラーニング、マーケティング、需給予測、不正検知を筆頭にデータ利用が多角化し、データ分析基盤に求められる役割も多様化が進んでいます。
本書では、データ分析基盤の「今」に焦点を合わせ、基本用語の整理から歴史、クラウドをはじめとしたインフラ、主要な技術スタック、システムモデル、データドリブンのための可視化&測定術まで徹底解説。
合わせて、長期視点に立ったユーザー中心の運用に欠かせない「セルフサービス」「SSoT」に基づいたルール作り、それらを実現するためのゾーン/タグ管理、メタデータ管理、データの品質管理も平易にまとめました。
広くデータ分析基盤に関わるエンジニア/ユーザーの方々へ、ユーザーが自然と集まり、データ活用を促進するシステムの実現のために、実践で活かせる考え方をお届けします。

目次

第1章 “入門”データ分析基盤―データ分析基盤を取り巻く「人」「技術」「環境」
第2章 データエンジニアリングの基礎知識―4つのレイヤー
第3章 データ分析基盤の管理&構築―セルフサービス、SSoT、タグ、ゾーン、メタデータ管理
第4章 データ分析基盤の技術スタック―データソースからアクセスレイヤー、クラスター、ワークフローエンジンまで
第5章 メタデータ管理―データを管理する「データ」の重要性
第6章 データマート&データウェアハウスとデータ整備―DIKWモデル、データ設計、スキーマ設計、最小限のルール
第7章 データ品質管理―質の高いデータを提供する
第8章 データ分析基盤から始まるデータドリブン―データ分析基盤の可視化&測定
Appendix “ビッグデータでも役立つ”RDB基礎講座

著者等紹介

斎藤友樹[サイトウユウキ]
SIerで官公庁、年金、広告などのシステムの要件定義~保守運用まで、SEやマネージャーとしてフロントエンド~サーバーサイドまでひととおり経験。現在は、事業会社にてビッグデータ分析に関するシステムの構築、蓄積したデータの活用を行う仕事に従事している。直近では利用者が数千万を超える環境で、ストリーミングデータの処理や一日あたり5000超のETLジョブを捌くデータ分析基盤のアーキテクチャ設計やデータ活用のためのしくみ作りを担当。また、AWSなどのパブリッククラウドイベントの登壇などを通して積極的に情報発信を行っている(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

nbhd

13
AIとかデータドリブンとか言うけれど、そのオオモトとなるデータはどうやって集めてくるんじゃい?っつうことで、データ分析基盤である。温度センサーなり、銀行口座の利用履歴なりのデータを、にゅにゅい~っと1カ所に集めて(レイク)、使いやすいように整理して保管(ウェアハウス)、グラフにしたりレポートにしたりする(マート)…とまぁ、データはこんなふうに流通している。教科書的ではあるけど、「にゅにゅい~」感が伝わってくる。ネットって当たり前だけど、そこに通っているのはデータなんだなぁ、ってことを読んで実感できた。2024/11/28

ぶう

11
少し前までであれば、データを扱うのは一部のエンジニアとアナリストくらいであり、関係する人の範囲は限られていたと言える。しかし昨今ではデータの民主化という方向に進んでおり、必要な人が必要な時にデータを選んで使う、謂わばセルフサービスの時代となってきている。データ基盤環境のクラウド化により、技術的なハードルが下がってきたことも、データの民主化の加速した要因の一つであろう。本書は技術面だけでなく、データ活用を組織に浸透させる方法まで書かれており、DXを進めている企業には参考になる部分が多いのではないだろうか。2022/07/14

YK

5
データエンジニアリングも認知を増してきたところでの本書。そして日本では初めての汎用的に書かれた書籍かと思う。多くの書籍は技術スタックの紹介で終わる一方で、本書はさらに技術を使ってデータ組織や周りの別組織との関わり方をどの様にしていくべきか?どの様に技術を使うべきか?という本来のデータ活用の目的に向かって書かれている。ソースコードをガッツリ見たい!という人には向かないが、細かい設定をつらつら書かれるよりずっと価値の高い内容になっている。 2022/02/26

ireadertj

4
データエンジニアのために、エンジニア目線で網羅的にかつ、限定のクラウドとかでなく汎用的にデータ活用を書かれた日本の書籍はこれが最初ではないのかな。 ただ、網羅的かつ入門と出しているので、一つ一つにはページを割ききれていないところがあるので、データエンジニア初学者とかはもしかしたら難しいとか、実際にどうしたらとかはあるかも。2022/02/18

yyhhyy

3
この分野は明るくないので自分は判断できない。教科書的な外観を掴むもの。データレイク~データマートの説明や昨今の社内体制のトレンドなどの紹介から入る。2023/07/30

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/19267626
  • ご注意事項

最近チェックした商品