出版社内容情報
本書は初学者がデータサイエンスを理解する上で必要な基礎知識を1冊にまとめたものです。一般的なデータサイエンスの本では省略されがちな前提知識、たとえばハードウェア技術、ソフトウェア技術、アルゴリズムの話なども、データサイエンスとの関連を強調しながら丁寧に解説するように努めました。本書を通じてざっとでもデータサイエンスを支える基礎技術をつかんでいただければ幸いです。とはいえ読者によっては「プログラミングの話は興味ない」「商用利用するわけではないからデータベースの話は関係ない」など、さまざまなニーズがあることでしょう。そうしたニーズにも応えられるように、なるべく章ごとに完結するように書かれているため、好きな箇所から読み進めてもらって構いません。
内容説明
データの量、速さ、種類、正確さの変化に応じ価値を創造するのがデータサイエンティストの仕事である(「ビッグデータとは」)。多種あるプログラミング言語の中でも、基本的なスタイルが学べるPythonがおすすめ(「どの言語を使うか」)。確率的勾配法を用いれば、ビッグデータに対する計算量を減らし、それなりに正しい結果を得られる(「ディープラーニングで利用される技術(1)」)など、初めて学ぶデータサイエンスの基礎20項目。
目次
第1部 データサイエンスの基本(データサイエンスとは)
第2部 データサイエンスの基礎技術(計算機の仕組み;プログラミングの基礎;アルゴリズム;データベース;最適化の方法)
第3部 統計学・機械学習の基礎(機械学習の基本;過学習とモデル選択;回帰問題と住宅価格;アンサンブル学習と住宅価格;分類問題;教師なし学習)
第4部 コーパスとネットワークの分析(トピックモデル;ネットワーク分析)
第5部 ディープラーニング(ニューラルネットワークの基礎;ディープラーニング;ディープラーニングによる系列データ分析;ディープラーニングによる画像分析)
著者等紹介
久野遼平[クノリョウヘイ]
東京大学大学院情報理工学系研究科数理・情報教育研究センター兼数理情報学専攻講師。キヤノングローバル戦略研究所研究員。1984年生まれ。慶應義塾大学経済学部卒業後、一橋大学大学院経済学研究科修士課程、スイス連邦工科大学チューリッヒ校博士課程を修了。国立情報学研究所の特任研究員、東京大学大学院情報理工学系研究科ソーシャルICT研究センター特任助教などを経て現職
木脇太一[キワキタイチ]
東京大学大学院情報理工学系研究科数理情報学専攻特任講師。1986年生まれ。東京大学大学院工学系研究科博士課程修了後、株式会社ユニーク勤務、東京大学大学院情報理工学系研究科数理情報学専攻特任助教を経て現職(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
ゼロ投資大学
こじか
ザラシ