出版社内容情報
【目次】
内容説明
未来につながるデータ分析基盤をつくるため。データ×データエンジニアリングに対する基本アプローチ&実践テクニックをいま学ぼう!システム&データ整備の現場の礎となる考え方をこの1冊で!
目次
データ分析基盤への招待 データ分析基盤の大枠を知ろう
ローカル端末で学ぶデータ分析基盤 ローカルのデータ分析基盤を利用して理解を促進しよう
バッチデータパイプライン バッチ処理の基本と実践
ストリーミングデータパイプライン バッチの知識をもとにストリーミング固有の問題に対処しよう
データパイプラインとアドオン機能 多機能なパイプラインを実装しよう
データパイプラインとデータ品質管理 データとデータ品質を相互運用しよう
データパイプラインとメタデータ管理 データとメタデータを相互運用しよう
データ分析基盤と開発プロセス 環境を整えて活動のスピードを上げよう
データマネジメントとドキュメンテーション データ分析基盤の秩序と活動方針を言語化しよう
データ分析基盤とパブリッククラウド クラウドでデータ分析基盤をシンプルにすばやく構築する
シンプル構成で始めるクラウド分析基盤 最小限の構成で体験するクラウド分析基盤
データ分析基盤と機械学習(ML)モデル データをもとにモデルを作成する活動についても知ろう
著者等紹介
斎藤友樹[サイトウユウキ]
SIerで官公庁、年金、広告などのシステムの要件定義~保守運用まで、SEやマネージャーとしてフロントエンド~サーバーサイドまでひととおり経験。現在は、事業会社にてビッグデータ分析に関するシステムの構築、蓄積したデータの活用を行う仕事に従事している。直近では利用者が数千万を超える環境で、ストリーミングデータの処理や一日あたり5000超のETLジョブを捌くデータ分析基盤のアーキテクチャ設計やデータ活用のためのしくみ作りを担当。また、AWSなどのパブリッククラウドイベントの登壇などを通して積極的に情報発信を行っている(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。



