Programmer’s SELECTION<br> 爆速Python―巨大データセットを扱うための高速化テクニック

個数:
電子版価格
¥3,960
  • 電子版あり

Programmer’s SELECTION
爆速Python―巨大データセットを扱うための高速化テクニック

  • 提携先に在庫がございます【僅少】
    通常、5~7日程度で出荷されます。
    ※納期遅延や、在庫切れで解約させていただく場合もございます。
    (※複数冊ご注文はお取り寄せとなります)
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【出荷予定日】
    通常、5~7日程度で出荷されます。

    【ご注意事項】 ※必ずお読みください
    ◆在庫状況は刻々と変化しており、ご注文手続き中やご注文後に在庫切れとなることがございます。
    ◆出荷予定日は確定ではなく、表示よりも出荷が遅れる場合が一部にございます。
    ◆複数冊をご注文の場合には全冊がお取り寄せとなります。お取り寄せの場合の納期や入手可否についてはこちらをご参照ください。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 352p/高さ 23cm
  • 商品コード 9784798183732
  • NDC分類 007.64
  • Cコード C3055

出版社内容情報

「そう、すべては速さのために」

Pythonでデータセットを扱う際、最後に重要になってくるのはやはり「処理速度」です。データが巨大であればあるほど、ちょっとした工夫が処理速度を向上させ、「データの氾濫」ともいえる現状を打開する鍵になってくれます。

Pythonの特性を理解しつつそのパフォーマンスを最大限に引き出し、さらにハイパフォーマンスなライブラリを正しく利用することができれば、遅い遅いといわれがちなPythonにおいても、爆速な処理を手にすることができるのです。

本書は、組み込み機能やスレッディング特性、CPythonのグローバルインタプリタロック(GIL)などに始まり、Cythonへの移行やGPUの利用に至るまでの多面的なアプローチを紹介し、単にマシン性能を上げたり、マシンの数を増やすだけでは得られない、効率的なPythonアプリケーションの記述をサポートします。

【本書は『Fast Python: High performance techniques for large datasets』の邦訳書です。】

◆◆◆◆◆もくじ◆◆◆◆◆

●Part 1 基礎的なアプローチ
 ・Chapter 1 データ処理の効率化が急がれている
 ・Chapter 2 組み込み機能のパフォーマンスを最大限に引き出す
 ・Chapter 3 並行性、並列性、非同期処理
 ・Chapter 4 ハイパフォーマンスなNumPy
●Part 2 ハードウェア
 ・Chapter 5 Cythonを使って重要なコードを再実装する
 ・Chapter 6 メモリ階層、ストレージ、ネットワーク
●Part 3 現代のデータ処理のためのアプリケーションとライブラリ
 ・Chapter 7 ハイパフォーマンスなpandasとApache Arrow
 ・Chapter 8 ビッグデータの格納
●Part 4 高度なトピック
 ・Chapter 9 GPUコンピューティングを使ったデータ分析
 ・Chapter 10 Daskを使ったビッグデータの分析

 ・付録A 環境のセットアップ
 ・付録B Numbaを使って効率的な低レベルコードを生成する

内容説明

本書の目的は、Pythonエコシステムでより効率的なアプリケーションを記述する手助けをすることにあります。より効率的とは、コードが使うCPUサイクル、ストレージ領域、ネットワーク通信が少なくなることを意味します。本書では、パフォーマンスの問題に総合的なアプローチでのぞみます。ピュアPythonでのコード最適化テクニックについて説明するだけではなく、NumPyやpandasなど広く使われているデータライブラリの効率的な使い方についても検討します。Pythonでは十分なパフォーマンスが得られないケースがあるため、スピードがさらに求められる場合はCythonについても検討します。この総合的なアプローチの一環として、コードの設計にハードウェアが与える影響にも目を向け、現代のコンピュータアーキテクチャがアルゴリズムのパフォーマンスにおよぼす影響を分析します。また、ネットワークアーキテクチャが効率におよぼす影響と、高速なデータ分析でのGPUコンピューティングの使い方も調べます。

目次

1 基礎的なアプローチ(データ処理の効率化が急がれている;組み込み機能のパフォーマンスを最大限に引き出す;並行性、並列性、非同期処理;ハイパフォーマンスなNumPy)
2 ハードウェア(Cythonを使って重要なコードを再実装する;メモリ階層、ストレージ、ネットワーク)
3 現代のデータ処理のためのアプリケーションとライブラリ(ハイパフォーマンスなpandasとApache Arrow;ビッグデータの格納)
4 高度なトピック(GPUコンピューティングを使ったデータ分析;Daskを使ったビッグデータの分析)
付録A 環境のセットアップ
付録B Numbaを使って効率的な低レベルコードを生成する

著者等紹介

アントン,チアゴ・ロドリゲス[アントン,チアゴロドリゲス] [Ant〓o,Tiago Rodrigues]
情報学の工学士号とバイオインフォマティクスの博士号を持つ。現在はバイオテクノロジー分野に従事している。科学計算とデータエンジニアリングのタスクを実行するためにPythonとそのすべてのライブラリを使っている。アルゴリズムの重要な部分を最適化するために、CやRustなどの低水準言語をよく使っている。現在はAmazon AWSベースのインフラで開発を行っているが、キャリアの大部分ではオンプレミスのコンピューティングクラウドと科学クラウドを使っていた。業界での活動に加えて、科学計算の研究では、ケンブリッジ大学とオックスフォード大学でデータ分析のポスドクを務めた経験がある。モンタナ大学では、リサーチサイエンティストとして生物学データを分析するための科学計算インフラ全体を一から開発した(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

最近チェックした商品