実践Apache Iceberg―高効率・高生産性を実現するオープンなデータ基盤の構築と運用

個数:

実践Apache Iceberg―高効率・高生産性を実現するオープンなデータ基盤の構築と運用

  • ウェブストアに27冊在庫がございます。(2025年11月28日 05時32分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 576p/高さ 23cm
  • 商品コード 9784297150747
  • NDC分類 007.63
  • Cコード C3055

出版社内容情報

Apache Icebergは、ストレージ上のファイル群を抽象化し分散クエリエンジンで扱うためのオープンな「テーブルフォーマット」です。本書では、データレイク構築に関する基本的な考え方やIcebergを使うことのメリットといった基本から、Sparkなどの各種分散クエリエンジンにおける実践的な活用方法、そして実運用のためのノウハウまで、豊富なハンズオンとともに解説。次世代のデータ基盤の構築・運用に関わるエンジニア必携の一冊です。


【目次】

■[第1部]Apache Icebergの基本
■■第1章:データレイクの課題とApache Iceberg
・Icebergというテーブルフォーマット
・データレイクのコンセプト
・データレイクの構成要素
・Iceberg登場以前のデータレイクの課題
・Icebergによるデータレイクの課題解決
・データ基盤におけるIcebergの役割
・Icebergを導入する際の注意点

■■第2章:Apache Icebergの仕組みと機能
・「Iceberg」が指すもの
・Icebergテーブルの構造
・代表的なクエリのライフサイクル
・タイムトラベルとロールバックによるデータ復元
・トランザクション分離レベルと同時実行制御
・スキーマ定義
・ソート順の進化
・Icebergにおけるパーティショニング
・ビュー
・テーブルフォーマットバージョン3

■■第3章:Icebergカタログとストレージ
・「カタログ」と「ストレージ」という重要概念
・さまざまなIcebergカタログ
・Icebergのストレージ
・Icebergカタログおよびストレージ実装の設定

■[第2部]分散クエリエンジンでの利用
■■第4章:Apache Spark
・Apache Sparkの概要
・Sparkでデータ処理を実行する
・Icebergの利用を開始する
・Icebergを利用する際のパラメータ設定
・基本的なIceberg機能の利用
・高度なIceberg機能の利用
・ストリーミングでの利用

■■第5章:Apache Flink
・Apache Flinkの概要
・Flinkでデータ処理を実行する
・Icebergの利用を開始する
・基本的なIceberg機能の利用
・高度なIceberg機能の利用

■■第6章:Trino
・Trinoの概要
・Trinoでデータ処理を実行する
・Icebergの利用を開始する
・DDL(Data Definition Language)
・DML(Data Manipulation Language)

■■第7章:Apache Hive
・Apache Hiveの概要
・Hiveでデータ処理を実行する
・Icebergの利用を開始する
・Hiveで実行できるIcebergの機能
・DDL(Data Definition Language)
・DML(Data Man

内容説明

データの価値を最大化するテーブルフォーマットを実践的なハンズオンとともに完全解説!データレイクとIcebergの基本概念。分散クエリエンジンごとの利用方法。Amazon Web Servicesで活かす運用ノウハウ。具体的なユースケースごとのパターン。本番運用を見据えたテクニック。

目次

第1部 Apache Icebergの基本(データレイクの課題とApache Iceberg;Apache Icebergの仕組みと機能;Icebergカタログとストレージ)
第2部 分散クエリエンジンでの利用(Apache Spark;Apache Flink;Trino ほか)
第3部 ユースケースと応用(ユースケースとソリューションパターン;AWSでIcebergを活用する;運用管理 ほか)

感想・レビュー

※以下の感想・レビューは、株式会社ドワンゴの提供する「読書メーター」によるものです。

pea47581220

0
完全解説と銘打ってるだけあり、かなり広範にハンズオンで実践可能な形で丁寧に説明してくれている。 こういう有益なOSSの詳しい解説書をもっと沢山読みたいと思いました。 時間がなくて手が動かせなかったが、また入用に読み直したいです。2025/11/18

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/22774426
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ドワンゴの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ドワンゴ」にご確認ください。

最近チェックした商品