KS情報科学専門書<br> Polarsとpandasで学ぶ データ処理アイデアレシピ55

個数:1
紙書籍版価格
¥3,960
  • 電子書籍
  • Reader
  • ポイントキャンペーン

KS情報科学専門書
Polarsとpandasで学ぶ データ処理アイデアレシピ55

  • 著者名:冨山吉孝【著】/早川裕樹【著】/齋藤慎一朗【著】
  • 価格 ¥3,960(本体¥3,600)
  • 講談社(2024/12発売)
  • 夏休みの締めくくり!Kinoppy 電子書籍・電子洋書 全点ポイント30倍キャンペーン(~8/24)
  • ポイント 1,080pt (実際に付与されるポイントはご注文内容確認画面でご確認下さい)
  • ISBN:9784065369807

ファイル: /

内容説明

★「この結果がほしい」が、驚くほど簡単に実現する!★

大注目の高速ライブラリPolarsと定番ライブラリpandasによるデータ処理が両方とも学べる!
知っておきたいテクニックが盛りだくさん!

【小野寺和樹氏(エヌビディア合同会社 シニアディープラーニングデータサイエンティスト)推薦!】
本書は、Pythonを扱うデータサイエンティスト必携の実践書です。
高速データ処理ツールPolarsの驚異的なパフォーマンスを活かした具体的な例を通じて、読者のデータ分析スキルを飛躍的に向上させます。
pandasとの比較や使い分けも丁寧に解説されており、現場で役立つ55のレシピが収録されています。
今度こそPolarsをマスターし、次世代のデータサイエンティストを目指すすべての人におすすめの一冊です。

【河合俊典氏(エムスリー株式会社 VPoE)推薦!】
機械学習エンジニア、データサイエンティストが扱うツールは、日々進化しています。
本書は、その最先端ツールの1つであるPolarsについて、まるで日本語チュートリアルであるかのように解説しています。
ドキュメントや技術ブログでは得られにくい、「いつカラムの操作をするのか」「交差検証をなぜ行うのか」などデータ分析の5W1Hを抑えながら、体系的にPolarsを学べる一冊になっているなと感じました。
Polarsって何?という方、Polarsに対して尻込みしていたすべての方におすすめの一冊です!

【主な内容】
準備編
1日目 pandasの概要
2日目 Polarsの概要

特訓編
1日目 データの確認:Recipe01-09
2日目 データの操作:Recipe10-14
3日目 データの抽出:Recipe15-26
4日目 データの加工:Recipe27-39
5日目 データの集計:Recipe40-43
6日目 時系列データの処理:Recipe44-48
7日目 遅延評価:Recipe49-51
8日目 実践パイプライン:Recipe52-55

目次

準備1日目 pandas の概要
準備2日目 Polars の概要
特訓1日目 データの確認
01 データの表示
02 データの列名を確認
03 データの大きさの確認
04 各列のデータ型を確認
05 データの概要を確認
06 列ごとのユニークな要素数の確認
07 列ごとのユニークな要素を確認
08 ユニークな要素ごとに重複数のカウント
09 特定の列に対する統計量の確認
特訓2日目 データの操作
10 ファイルの読み込み
11 データフレームの特定ファイル形式への書き出し
12 データフレームのソート
13 データフレームの複製
14 データフレームの作成
特訓3日目 データの抽出
15 データフレームから複数列を抽出
16 データフレームから特定データ型の列抽出
17 データフレームの特定列の除外
18 データフレームの特定行の抽出
19 特定条件にマッチする行の抽出
20 複数条件にマッチする行の抽出1
21 複数条件にマッチする行の抽出2
22 特定列が欠損値でない行の抽出
23 欠損値を含む行の削除
24 値リストのどれかに合致する要素を持つ行の抽出
25 特定の文字列を含む行の抽出
26 指定された数だけランダムにデータをサンプリング
特訓4日目 データの加工
27 既存列へのデータ処理
28 特定列をデータ処理し、データ型を変更
29 既存列を用いて新規列を作成する
30 条件に応じた値の代入
31 列へのユーザー定義関数の適用
32 データフレームの列名を一括変更
33 データフレームの特定の列名を変更
34 欠損値の補完
35 NumPy 配列への変換
36 データのビニング
37 重複行の削除
38 データフレームの連結
39 データフレームの結合
特訓5日目 データの集計
40 列の集計結果を計算
41 列の集計結果を新規列として追加
42 累積和を計算
43 複数列の集計結果を計算
特訓6日目 時系列データの処理
44 日時データから年と月を取得する
45 時間軸に沿って値をシフトし、過去値の列を作る
46 行の差分を新規の列として追加する
47 時間に基づいた集約を行い、新規列を作成する
48 特定の期間ごとのデータの集計
特訓7日目 遅延評価
49 遅延評価の基礎(Python 編)
50 Polars の遅延評価機能lazy API
51 クエリ最適化とStreaming API
特訓8日目 実践パイプライン
52 EDA
53 前処理と特徴量エンジニアリング
54 機械学習モデルの学習
55 機械学習モデルの評価・推論

最近チェックした商品