データサイエンス入門シリーズ<br> データサイエンスのためのデータベース

個数:1
紙書籍版価格
¥2,640
  • 電子書籍
  • Reader

データサイエンス入門シリーズ
データサイエンスのためのデータベース

  • ISBN:9784065193105

ファイル: /

内容説明

ツールとして不可欠な技術をコンパクトに!

・データベースの活用を目的とし、SQLの操作は「問い合わせ」を中心に、MySQLに準拠して解説!
・関係データベースの基本とその使い方、データの可視化、NoSQLまで網羅!
・実践的なデータ分析事例として、Wikipediaダンプデータの分析を紹介!

【サポートページ】
https://sites.google.com/view/dbfordatascience

【主な内容】
1章 はじめに
2章 関係データベースの基本
3章 SQLと正規化
4章 データの可視化と分析
5章 NoSQL
6章 実践的データ分析事例

【「巻頭言」より抜粋】
文部科学省は「数理及びデータサイエンスに係る教育強化拠点」6 大学(北海道大学、東京大学、滋賀大学、京都大学、大阪大学、九州大学)を選定し、拠点校は「数理・データサイエンス教育強化拠点コンソーシアム」を設立して、全国の大学に向けたデータサイエンス教育の指針や教育コンテンツの作成をおこなっています。
本シリーズは、コンソーシアムのカリキュラム分科会が作成したデータサイエンスに関するスキルセットに準拠した標準的な教科書シリーズを目指して編集されました。またコンソーシアムの教材分科会委員の先生方には各巻の原稿を読んでいただき、貴重なコメントをいただきました。
データサイエンスは、従来からの統計学とデータサイエンスに必要な情報学の二つの分野を基礎としますが、データサイエンスの教育のためには、データという共通点からこれらの二つの分野を融合的に扱うことが必要です。この点で本シリーズは、これまでの統計学やコンピュータ科学の個々の教科書とは性格を異にしており、ビッグデータの時代にふさわしい内容を提供します。本シリーズが全国の大学で活用されることを期待いたします。
――編集委員長 竹村彰通(滋賀大学データサイエンス学部学部長、教授)

【推薦の言葉】
データサイエンスの教育の場や実践の場で利用されることを強く意識して、動機付け、題材選び、説明の仕方、例題選びが工夫されており、従来の教科書とは異なりデータサイエンス向けの入門書となっている。
――北川源四郎(東京大学特任教授、元統計数理研究所所長)

国を挙げて先端IT人材の育成を迅速に進める必要があり、本シリーズはまさにこの目的に合致しています。本シリーズが、初学者にとって信頼できる案内人となることを期待します。
――杉山将(理化学研究所革新知能統合研究センターセンター長、東京大学教授)

目次

第1章 はじめに
1.1 データサイエンスのためのデータベース
1.2 データベースの歴史
1.2.1 関係データベース
1.2.2 NoSQL
第2章 関係データベースの基本
2.1 データの関係モデル
2.1.1 「関係」の概念とそれに基づくデータの表現
2.1.2 データのリレーションによる表現
2.1.3 リレーションのテーブルによる表示
2.1.4 テーブルに関する注意
2.1.5 関係スキーマ
2.1.6 インスタンス
2.1.7 タプルからの成分の切り出し
2.1.8 第1正規形
2.1.9 超キーと候補キー,主キー
2.2 整合性制約
2.2.1 ドメイン制約
2.2.2 主キー制約
2.2.3 外部キーと参照整合性制約
2.3 関係代数
2.3.1 テーブルからのデータ検索
2.3.2 関係代数の集合演算
2.3.3 「関係代数」独自の演算
2.3.4 実テーブルと導出テーブル,ビューテーブル
第3章 SQLと正規化
3.1 SQL
3.1.1 データ検索
3.1.2 データベースの定義・更新・管理
3.2 正規化
3.2.1 更新時異常
3.2.2 関数従属性
3.2.3 完全関数従属性と第2正規形
3.2.4 推移従属性と第3正規形
3.2.5 無損失分解
第4章 データの可視化と分析
4.1 データの可視化による分析
4.2 データベースの可視化
4.2.1 グラフによるデータベースの可視化
4.2.2 表計算ソフトとSQLを用いたデータベースの可視化
4.2.3 データベース可視化ソフトの利用
4.3 OLAP
4.3.1 OLAPの考え方
4.3.2 エクセルのピボットテーブルを用いたOLAP的分析
第5章 NoSQL
5.1 RDBMSの問題とNoSQLの分類
5.2 さまざまなNoSQLデータベース
5.2.1 Key-Value Storeデータベース
5.2.2 列指向データベース
5.2.3 ドキュメント指向データベース
5.2.4 RDFデータベース
5.2.5 グラフデータベース
5.2.6 その他のNoSQLデータベース
5.3 まとめ
第6章 実践的データ分析事例
6.1 RDBMSを用いたWikipediaダンプデータの分析
6.1.1 Wikipediaダンプデータ
6.1.2 言語間リンクを用いた翻訳辞書の構築
6.1.3 リダイレクトを用いた異表記辞書の構築
6.2 その他のソフトウェアと組み合わせたWikipediaダンプデータの分析
6.2.1 Wikipediaの情報を用いた単語の曖昧性解消
6.2.2 実験用データの構築
6.2.3 実験結果とその分析

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

Sean

5
リレーショナルデータベースではデータの重複は起こらないので、さいあく全列使えば一意的にデータを特定できる。そうならないようPrimary Keyを指定するが、どんなデータ集合(すなわちリレーション)になってもPrimary Keyの要件を満たすように制約をかけるのがRDB設計。データの呼び出し(=部分集合の指定)は、関係代数として集合論ぽく書いてあった。2022/02/17

takao

2
ふむ2021/12/01

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/15546926
  • ご注意事項