スケーラブルリアルタイムデータ分析入門―ラムダアーキテクチャによるビッグデータ処理

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ B5判/ページ数 364p/高さ 24cm
  • 商品コード 9784873117751
  • NDC分類 007.6
  • Cコード C3055

出版社内容情報

大規模データ処理において、データ分析を行うエンジニアであれば、知っておくべき情報を提供。スケーラブルで信頼性の高いリアルタイムデータ分析システムの理論と実装方法が理解できる!
絶え間なく入ってくる大量のデータをリアルタイムに処理・分析するストリームデータ処理を分散処理するための大規模データ処理システムを構築するために必要な概念とその実装手法を紹介します。大規模データ処理において、スケーラビリティと信頼性をどう担保するのか、サーバダウン時のデータ欠損を最小限に抑え、なおかつ保守性の高いシステム設計を実現するには、どのようなデータモデルとアーキテクチャが必要なのか、データ分析を行うエンジニアであれば、知っておくべき情報を提供します。

Nathan Marz[ネイサン マーズ]

James Warren[ジェイムス ウォーレン]

伊藤 真浩[イトウ マサヒロ]

木下 哲也[キノシタ テツヤ]

内容説明

絶え間なく入ってくる大量のストリームデータをリアルタイムに処理・分析するために必要な概念とその実現手法を紹介します。任意のクエリに対応しながら、スケーラビリティと信頼性をどう担保するのか、障害発生時にデータを復旧しやすく、汎用的で拡張性や保守性の高いシステム設計を実現するには、どのようなデータモデルとアーキテクチャが必要なのか。データ分析を行うエンジニアが備えておくべき知識と情報について、従来のアーキテクチャが持つ問題を解消するために著者が開発した「ラムダアーキテクチャ」のデータモデルに沿って解説します。

目次

ビッグデータを扱うための新しいパラダイム
1部 バッチ層(ビッグデータのためのデータモデル;ビッグデータのためのデータモデル詳説;バッチ層のデータストレージ;バッチ層のデータストレージ詳説;バッチ層;バッチ層詳説;バッチ層の例:アーキテクチャとアルゴリズム;バッチ層の例:実装)
2部 サービス層(サービス層;サービス層詳説)
3部 速度層(実時間ビュー;実時間ビュー詳説;キューイングとストリーム処理;キューイングとストリーム処理詳説;マイクロバッチストリーム処理;マイクロバッチストリーム処理詳説;ラムダアーキテクチャをより深く学ぶ)

著者等紹介

マーズ,ネイサン[マーズ,ネイサン] [Marz,Nathan]
Apache Stormの開発者であり、ラムダアーキテクチャの提唱者。なお、StormはTwitterの処理システムとして知られている

ウォーレン,ジェイムス[ウォーレン,ジェイムス] [Warren,James]
機械学習と科学計算をバックグラウンドに持つ分析アーキテクト

伊藤真浩[イトウマサヒロ]
ITエンジニアとして国内ITベンダに勤務。Linuxを中心としたオープンソースソフトウェア全般を対象にしており、カーネルのレイヤからWebアプリケーションのレイヤまで幅広く携わった。これまでに、科学計算用大規模PCクラスタシステムや金融機関の基幹システムの構築や運用などに携わった。学生時代に画像処理や認識を専攻し、工学修士号を取得

木下哲也[キノシタテツヤ]
1967年、川崎市生まれ。早稲田大学理工学部卒業。1991年、松下電器産業株式会社に入社。全文検索技術とその技術を利用したWebアプリケーション、VoIPによるネットワークシステムなどの研究開発に従事。2000年に退社し、現在は主にIT関連の技術書の翻訳、監訳に従事(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。