出版社内容情報
コマンドライン初学者に向けてコマンドライン処理の基礎からデータ分析に必要な操作を解説。タスクの流れに従って各種ツールを説明。
シェルを活用してデータ分析の一連の作業を効率化!
本書はコマンドライン初学者に向けてコマンドライン処理の基礎からデータ分析に必要な操作を解説。分析実務の大半を占めるデータの取得~加工~分析というタスクの流れに従って、各種ツールの説明が行われています。仮想マシンを使うことでWindowsでもサンプルを実行できるようになっているため、普段Windows/GUI環境でデータ分析をしている人にも理解しやすい内容です。
内容説明
データ分析作業における各フェーズでのコマンドラインツールの使い方から、効率化のためのワークフローの管理や並列処理などまでを幅広く紹介します。日本語版では監訳者による本書のテクニックを利用する時に壁になるであろう「日本語処理」と、実務で利用する場合の「ケーススタディ」を収録。エンジニアのみならず、データ分析に携わる全ての方に必携の一冊です。
目次
1章 イントロダクション
2章 さあ始めましょう
3章 データの獲得
4章 再利用可能なコマンドラインツールの作り方
5章 データのクレンジング
6章 データワークフローの管理
7章 データの精査
8章 並列パイプライン
9章 データのモデリング
10章 総まとめ
著者等紹介
ジャンセンス,ジャロエン[ジャンセンス,ジャロエン] [Janssens,Jeroen]
YPlan(今夜のお出かけアプリ)のシニアデータサイエンティストで、個々のユーザーにより適したイベントを推奨できるようにする機能の責任者。Maastricht大学で人工知能の修士号、Tilburg大学で機械学習の博士号を取得
太田満久[オオタミツヒサ]
1983年東京都生まれ。名古屋育ち。京都大学基礎物理学研究所にて素粒子論を専攻し、2010年に博士号を取得。この頃より機械学習への興味が強まり、データ分析を専業としていたブレインパッド社に新卒として入社。入社後は数学的なバックグラウンドを生かし、自然言語処理エンジンやレコメンドアルゴリズムの開発を担当。現在は全社に対する技術支援や最新技術の調査・検証を担う
下田倫大[シモダノリヒロ]
1985年大阪生まれ。金融系ベンチャー企業を経て、Web企業にて大規模データのサービス活用に関わる開発業務に従事。同企業にて、DSP/DMPの開発に携わりアドテクノロジーに興味を持つ。2013年8月ブレインパッドに入社。プライベートDMPサービスRtoasterの外部DSP/DMP連携開発や、リスティング広告の入札最適化ツールL2Mixerの開発を担当
増田泰彦[マスダヤスヒコ]
1980年神奈川県生まれ。2003年国際基督教大学言語学科卒業。教養学士。独立系メディアプランニング会社、アドビシステムズ(旧オムニチュア)を経てブレインパッドに入社。現在は株式会社Qubitalデータサイエンスに出向、マーケティングコンサルティング・プロジェクトマネジメントに従事
長尾高弘[ナガオタカヒロ]
1960年千葉県生まれ。東京大学教育学部卒。株式会社ロングテール社長(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。