入門PySpark―PythonとJupyterで活用するSpark 2エコシステム

個数:
  • ポイントキャンペーン

入門PySpark―PythonとJupyterで活用するSpark 2エコシステム

  • ウェブストアに1冊在庫がございます。(2025年05月04日 16時26分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 320p/高さ 24cm
  • 商品コード 9784873118185
  • NDC分類 007.63
  • Cコード C3055

出版社内容情報

Apache SparkをPythonから使うための方法とノウハウを書いた書籍。

内容説明

PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。

目次

1章 Sparkを理解する
2章 耐障害性分散データセット
3章 DataFrame
4章 データのモデリングの準備
5章 MLlib
6章 MLパッケージ
7章 GraphFrames
8章 TensorFrames
9章 Blazeによるポリグロットパーシステンス
10章 Structured Streaming
11章 Sparkアプリケーションのパッケージ化

著者等紹介

ドラバス,トマズ[ドラバス,トマズ] [Drabas,Tomasz]
シアトル在住のMicrosoftに勤めるデータサイエンティスト。ヨーロッパ、オーストラリア、北米という3つの大陸で先端的なテクノロジー、航空、テレコミュニケーション、金融、コンサルティングといった数多くの分野に関わり、データ分析とデータサイエンスの経験を13年以上にわたって積んできた

リー,デニー[リー,デニー] [Lee,Denny]
MicrosoftのAzure Cosmos DBチームのプリンシパルプログラムマネージャー。インターネットスケールのインフラストラクチャ、データプラットフォーム、オンプレミスとクラウド両方の環境の予測分析システムの開発経験を18年以上も持っている、分散システムおよびデータサイエンスの現場のエンジニアである

玉川竜司[タマガワリュウジ]
Sky株式会社。本業はソフト開発(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

最近チェックした商品