Ｓｐａｒｋによる実践デ－タ解析 / ライザ，サンディ〈Ｒｙｚａ，Ｓａｎｄｙ〉/ラサーソン，ユーリ〈Ｌａｓｅｒｓｏｎ，Ｕｒｉ〉/オーエン，ショーン〈Ｏｗｅｎ，Ｓｅａｎ〉/ウィルス，ジョシュ【著】〈Ｗｉｌｌｓ，Ｊｏｓｈ〉/石川有【監訳】/玉川竜司【訳】

個数：

Ｓｐａｒｋによる実践データ解析―大規模データのための機械学習事例集

ライザ，サンディ〈Ｒｙｚａ，Ｓａｎｄｙ〉/ラサーソン，ユーリ〈Ｌａｓｅｒｓｏｎ，Ｕｒｉ〉/オーエン，ショーン〈Ｏｗｅｎ，Ｓｅａｎ〉/ウィルス，ジョシュ【著】〈Ｗｉｌｌｓ，Ｊｏｓｈ〉/石川有【監訳】/玉川竜司【訳】
価格 ¥3,740（本体¥3,400）
オライリー・ジャパン（2016/01発売）
ポイント 34pt

ウェブストアに1冊在庫がございます。（2026年07月23日 09時27分現在）
通常、ご注文翌日～2日後に出荷されます。
出荷予定日とご注意事項
※上記を必ずご確認ください

【ご注意事項】 ※必ずお読みください
◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
◆事情により出荷が遅れる場合がございます。
◆お届け日のご指定は承っておりません。
◆「帯」はお付けできない場合がございます。
◆画像の表紙や帯等は実物とは異なる場合があります。
◆特に表記のない限り特典はありません。
◆別冊解答などの付属品はお付けできない場合がございます。
●3Dセキュア導入とクレジットカードによるお支払いについて
●店舗受取サービス（送料無料）もご利用いただけます。
ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら

サイズ B5判／ページ数 309p／高さ 24cm
商品コード 9784873117508
NDC分類 007.6
Cコード C3055

出版社内容情報

ビッグデータを活用するためのデータサイエンスについてSparkを通して学ぶことができる書籍。

Sparkの基本を学んだ人が、さらにSparkでデータ分析をする方法を学ぶ本！
実際の利用シーンを踏まえており、ビッグデータを活用するためのデータサイエンスについてSparkを通して学ぶことができます。分析手法の簡単な理論解説も併記してあり、前半の章は分析に詳しくエンジニアもハンズオンで学ぶことができます。またSparkをどう活かすかを学ぶだけでなく、実際のデータを利用する上でぶつかる問題をどうクリアするかまで解説されています。

内容説明

本書は、データサイエンスの４人のエキスパートがＳｐａｒｋでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるＳｐａｒｋの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてＳｐａｒｋとＳｃａｌａによるデータ処理の基本を学習し、Ｓｐａｒｋを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「ＳｐａｒｋＲについて」と千葉立寛氏、小野寺民也氏による「ＳｐａｒｋのＪＶＭ、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。

ビッグデータの分析
ＳｃａｌａとＳｐａｒｋによるデータ分析の紹介
音楽のレコメンドとＡｕｄｉｏｓｃｒｏｂｂｌｅｒデータセット
決定木を使った森林被覆の予測
Ｋ平均クラスタリングを使ったネットワークトラフィックにおける異常の検出
潜在意味解析を使ったＷｉｋｉｐｅｄｉａの理解
ＧｒａｐｈＸを使った共起ネットワークの分析
ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析
モンテカルロシミュレーションによる金融リスクの推定
ゲノムデータの分析とＢＤＧプロジェクト
ＰｙＳｐａｒｋとＴｈｕｎｄｅｒを使った神経画像データの分析
Ｓｐａｒｋの詳細
ＭＬｌｉｂ　Ｐｉｐｅｌｉｎｅｓ　ＡＰＩ
ＳｐａｒｋＲについて
ＳｐａｒｋのＪＶＭ、ＯＳレベルのチューニングによる高速化

著者等紹介

ライザ，サンディ［ライザ，サンディ］［Ｒｙｚａ，Ｓａｎｄｙ］
Ｃｌｏｕｄｅｒａ社のデータサイエンティストであり、Ａｐａｃｈｅ　Ｓｐａｒｋプロジェクトの活発なコントリビュータ。近年はＣｌｏｕｄｅｒａでのＡｐａｃｈｅの開発をリードしており、Ｓｐａｒｋによるさまざまな分析のユースケースにおける顧客の支援に時間を費やしている。Ｈａｄｏｏｐ　Ｐｒｏｊｅｃｔ　Ｍａｎａｇｅｍｅｎｔ　Ｃｏｍｍｉｔｔｅｅのメンバーでもある

ラサーソン，ユーリ［ラサーソン，ユーリ］［Ｌａｓｅｒｓｏｎ，Ｕｒｉ］
Ｃｌｏｕｄｅｒａ社のデータサイエンティスト。Ｃｌｏｕｄｅｒａでは、Ｈａｄｏｏｐエコシステム中のＰｙｔｈｏｎにフォーカスしている。また、ライフサイエンスやヘルスケアを中心とする広範囲の問題に対して、Ｈａｄｏｏｐを導入する支援をしている。Ｕｒｉは以前、ＭＩＴでバイオメディカルエンジニアリングでＰｈ．Ｄの取得を目指す傍ら、次世代診断の企業であるＧｏｏｄ　Ｓｔａｒｔ　Ｇｅｎｅｔｉｃｓを共同設立した

オーエン，ショーン［オーエン，ショーン］［Ｏｗｅｎ，Ｓｅａｎ］
Ｃｌｏｕｄｅｒａ社でヨーロッパ、中東及びアフリカを担当するデータサイエンスのディレクター。２００９年以来、Ａｐａｃｈｅの機械学習プロジェクトであるＭａｈｏｕｔに対して大きく貢献しており、そのレコメンデーションフレームワークであるＴａｓｔｅを作成した。ｌａｍｂｄａアーキテクチャの原理の上に構築された、Ｈａｄｏｏｐ上の大規模リアルタイム学習のためのＯｒｙｘ（以前はＭｙｒｒｉｘと呼ばれていた）プロジェクトを立ち上げた

ウィルス，ジョシュ［ウィルス，ジョシュ］［Ｗｉｌｌｓ，Ｊｏｓｈ］
Ｃｌｏｕｄｅｒａ社のデータサイエンスのシニアディレクターであり、幅広い業界に渡って、Ｈａｄｏｏｐベースのソリューションを開発するために顧客及びエンジニアと共に働いている。最適化されたＭａｐＲｅｄｕｃｅ及びＳｐａｒｋのパイプラインをＪａｖａで構築するためのＡｐａｃｈｅ　Ｃｒｕｎｃｈプロジェクトの創始者であり、ＶＰでもある。Ｃｌｏｕｄｅｒａに入社する以前は、Ｇｏｏｇｌｅに勤めており、オークションのシステムの仕事をした後、Ｇｏｏｇｌｅ＋の分析インフラストラクチャの開発をリードしていた

石川有［イシカワユウ］
株式会社リクルートテクノロジーズのアドバンスドテクノロジーラボに所属。株式会社ミクシィ在籍時にＨａｄｏｏｐやＨｉｖｅなどの分散処理システムに興味を持ち、分析基盤構築からアプリケーション設計、データサイエンス業務まで幅広くこなす。現在は、Ａｐａｃｈｅ　Ｓｐａｒｋの特に機械学習コンポーネントＭＬｌｉｂの開発に従事している（本データはこの書籍が刊行された当時に掲載されていたものです）
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。