出版社内容情報
著者らが開発した人気のtidydataパッケージを使って、Twitterやニュースサイト、NASAのメタデータなどを分析。「tidy」データの概念に基づいてRでテキストマイニングを行う!
取得した生データをまずは扱いやすいtidyデータに変換してデータ分析を行うことが、最近のRで主流となりつつありますが、本書はそのコンセプトに基づき、著者らが開発した人気のtidydataパッケージを使って、Twitterやニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルなテキストマイニング手法を提示します。
Julia Silge[ジュリア シルゲ]
著・文・その他
David Robinson[デビット ロビンソン]
著・文・その他
大橋 真也[オオハシ シンヤ]
監修
長尾 高弘[ナガオ タカヒロ]
翻訳
内容説明
「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルかつ応用力抜群のテキストマイニング手法を提示します。
目次
1章 整理テキスト形式
2章 整理データを使ったセンチメント分析
3章 単語の出現頻度と特定の文書での出現頻度の分析:tf‐idf
4章 単語間の関係:nグラムと相関
5章 未整理形式へ(から)の変換
6章 トピックモデリング
7章 ケーススタディ:Twitterアーカイブの比較
8章 ケーススタディ:NASAメタデータのマイニング
9章 ケーススタディ:Usenetテキストの分析
著者等紹介
シルジ,ジュリア[シルジ,ジュリア] [Silge,Julia]
Stack Overflowのデータサイエンティスト。複雑なデータセットの分析、多様なユーザとの技術トピックのやり取りを行う。天体物理学のPhDを取得
ロビンソン,デビッド[ロビンソン,デビッド] [Robinson,David]
Stack Overflowのデータサイエンティスト。プリンストン大で量子・計算生物学のPhDを取得。broom、gganimate、fuzzyjoin、sidyrなどのオープンソースのRパッケージの開発を楽しむ
大橋真也[オオハシシンヤ]
千葉大学理学部数学科卒業、千葉大学大学院教育学研究科修士課程修了。千葉県公立高等学校教諭。千葉大学非常勤講師、Apple Distinguished Educator、Wolfram Education Group、日本数式処理学会、CIEC(コンピュータ利用教育学会)。千葉県立千葉中学校・千葉高等学校数学科教諭
長尾高弘[ナガオタカヒロ]
1960年生まれ。東京大学教育学部卒。1987年頃からアルバイトで技術翻訳を始め、1988年に(株)エーピーラボに入社し、取締役として97年まで在籍する。1997年に(株)ロングテールを設立し、社長に就任(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。