内容説明
本書はPythonによる自然言語処理、あるいはテキストマイニングの初歩について解説したものです。
テキストマイニングとは、テキストをコンピュータで探索(マイニング)する技術の総称です。ここで「テキスト」とは、小説や論文、あるいは新聞や雑誌の記事にとどまらず、インターネット上のブログ、あるいはSNSに投稿された文章など、およそ人間の言葉で書かれたものを指します。
Pythonの基本からテキスト分析の手順、形態素解析器の導入、さまざまな分析手法についてわかりやすく解説しています。また、本書の最後に、ディープラーニングを使ったテキストマイニング事例についても紹介します。
なお、本書の一部については解説動画が用意されています。
目次
CHAPTER 01 データマイニングとテキストマイニング
CHAPTER 02 Python速習
CHAPTER 03 テキストマイニングの準備
CHAPTER 04 MeCabによる形態素解析と抽出語の選択
CHAPTER 05 Janome
CHAPTER 06 spaCyとGiNZA
CHAPTER 07 Bag of Words(BoW)
CHAPTER 08 アンケート分析
CHAPTER 09 テキストの分類
CHAPTER 10 トピックモデル
CHAPTER 11 単語分散表現
CHAPTER 12 huggingface-transformers(BERT)
APPENDIX 青空文庫とGoogle Colaboratoryの利用
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
tieckP(ティークP)
7
コードを全体に厳密に見たわけではないけれども、ミスが多いのであまりお勧めできない(また値段に質が合っていない)。「中学生は35人のうち18人が「満足」と答え、高校生は29人のうち14人が「満足」と回答していますから、前者は約0.51、後者は約0.52となり、高校生グループの方が「満足」と回答する割合が少しだけ高くなっています」(179頁)という一節を著者が書き(しかも、15を14と書き間違えたのではなく実際にデータは14)、編集者も気づかないのはおかしい。2025/02/21