内容説明
今やテキストマイニングは,文章を単語に切り分けて,単語の出現頻度を数えるだけにはとどまりません.
商品やイベントに対するSNS上の意見をポジティブ・ネガティブに分ければ,何が評価されて,どこを改善すべきかが一目瞭然.
政治家の演説のトピックが,時代とともにどう移り変わってきたかを解析すると,社会の変化を見て取ることもできます.
小説の話題展開の流れや,登場人物とキーワードの結びつきも,自動で分析可能です.
文書解析で本当にやりたかったこれらのことは,Rで手軽に実現できます.
テキストマイニング定番書の著者による,次の一歩のためのやさしい手引きです.
[もっと基本的なことから学びたい方は,同著者による「Rによるテキストマイニング入門[第2版](森北出版)」もご覧ください]
〈本書で扱う主な内容〉
●センチメント分析
日本語極性辞書を用いて,単語の極性からテキスト全体がポジティブかネガティブか判断.
●単語分散表現
単語の頻度だけでなく,出現位置に注目し,単語どうしの意味の関連性を数値化.
●機械学習,ディープラーニング
機械学習を用いて,より高度な解析も実現.Pythonを前提とした訓練済みモデルやディープラーニングのフレームワークも,RStudioから簡単に利用可能.
目次
第1章 Rによる日本語テキスト解析の基礎
第2章 センチメント分析
第3章 構造的トピックモデル
第4章 Twitter投稿テキストの評価
第5章 機械学習による予測
第6章 単語分散表現
第7章 RからPythonライブラリを実行
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
Atsumi_SAKURADA
1
「KH Coderで事足りるやないか!」…お待ちください、R言語が多少使える方なら、この本でtweetのポジ・ネガ分析なんかもできます。「ヤフーリアルタイム検索があるじゃん」…まあそうですが、機械学習の入門もここにはあります。「Pythonでよくない?」…RStudioを通したやり方にも触れられています――などという擁護はともかく、既存のGUIのある道具に飽き足らない方向けに、まずはそれをコードを書いて模倣し、自分なりのやり方の第一歩を踏み出すための本です。2020/12/02