出版社内容情報
データサイエンティストに求められるスキルは、いまや分析技術だけではありません。実務で活躍できるデータサイエンティストになるためには、チームでの働き方も身に付けなければいけないでしょう。本書では、分析環境の準備・分析データのチェックから、機械学習モデルの運用やプロトタイプ開発まで、データサイエンティストが抑えるべき「分析前後」の知識を身に付けられます。ワンランク上のデータサイエンティストになるための、強力なガイドとなる本です。
【目次】
第1章 実務で生き抜くためのエンジニアリングスキル
1.1 データサイエンティストを取り巻く環境の変遷
1.1.1 希少価値が高かったデータサイエンティスト黎明期
1.1.2 技術民主化の波とPoC 止まりの現実
1.1.3 データサイエンスを価値に繋げるために
1.2 プロジェクトで求められるエンジニアリングスキル
1.2.1 データサイエンスプロジェクトのフロー
1.2.2 データサイエンティストのスキル習得プロセスによる課題
1.2.3 データサイエンスプロジェクト特有の難しさ
1.2.4 価値を生むために必要なエンジニアリングスキル
1.3 まとめ
第2章 環境構築
2.1 分析の土台としての環境構築
2.1.1 なぜ環境構築が大切か
2.1.2 適切な環境構築をするために
2.2 リポジトリの構造を整える
2.2.1 適切な構造のリポジトリを作るメリット
2.2.2 本書で扱うリポジトリ構成
2.3 VS Codeでの開発環境の整備
2.3.1 VS Code の設定
2.3.2 VS Code の拡張機能
2.3.3 VS Code のデバッガ
2.3.4 VS Code のショートカット
2.4 Dev Container による仮想環境構築
2.4.1 仮想環境とは
2.4.2 仮想環境の種類
2.4.3 Docker とDocker Compose
2.4.4 Dev Container の使い方
2.5 uv によるパッケージ管理
2.5.1 パッケージ管理
2.5.2 パッケージマネージャーの比較
2.5.3 uv によるパッケージ管理
2.6 まとめ
第3章 コードの品質管理
3.1 Notebookだけのデータサイエンティストからの卒業
3.1.1 Notebookの手軽さと課題
3.1.2 Notebook vs Python Script
3.1.3 NotebookユーザーのためのPython Script入門
3.1.4 一歩上のNotebookの使い方
3.2 コード品質とは
3.2.1 コード品質の重要性
3.2.2 品質の高いコードとは
3.3 品質の高いコードとその実現方法
3.3.1 関数
3.3.2 クラス
3.3.3 命名
3.3.4 コメントの書き方
3.3.5 コーディング規約
3.3.6 型ヒントと静的型チェック
3.3.7 テスト
3.3.8 品質の高いコードを書けるようになるためには
-
- 和書
- 牛鬼の滝