内容説明
本書は、ビッグデータを分散処理するためのフレームワーク「Apache Spark」のクエリのパフォーマンスチューニングのノウハウを紹介した解説書です。Apache Sparkでのクエリのチューニングのための知識として、基本的なアルゴリズム、ログの見方、チューニングの考え方、Salted Join, Skew Joinなどのチューニングの手法を説明します。
目次
第1章 Apache Sparkとは
第2章 チューニングのための情報取得
第3章 基本的なアルゴリズム
第4章 チューニングの考え方
第5章 チューニングの手法
-
- 電子書籍
- 台湾の半世紀 ――民主化と台湾化の現場…