出版社内容情報
本書はPythonによる自然言語処理、あるいはテキストマイニングの初歩について解説したものです。
テキストマイニングとは、テキストをコンピュータで探索(マイニング)する技術の総称です。ここで「テキスト」とは、小説や論文、あるいは新聞や雑誌の記事にとどまらず、インターネット上のブログ、あるいはSNSに投稿された文章など、およそ人間の言葉で書かれたものを指します。
Pythonの基本からテキスト分析の手順、形態素解析器の導入、さまざまな分析手法についてわかりやすく解説しています。また、本書の最後に、ディープラーニングを使ったテキストマイニング事例についても紹介します。
内容説明
自然言語処理の基礎から応用まで学べる!Pythonの基礎的な使い方から、形態素解析器によるさまざまな分析手法や、ディープラーニングを使ったテキストマイニングの事例を紹介!
目次
データマインニグとテキストマイニング
Python速習
テキストマイニングの準備
MeCabによる形態素解析と抽出語の選択
Janome
spaCyとGiNZA
Bag of Words(BoW)
アンケート分析
テキストの分類
トピックモデル〔ほか〕
著者等紹介
石田基広[イシダモトヒロ]
徳島大学社会産業理工学研究部教授・デザイン型AI教育研究センター長。大学ではプログラミング、データ分析、テキスト分析などの科目を担当している(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
tieckP(ティークP)
7
コードを全体に厳密に見たわけではないけれども、ミスが多いのであまりお勧めできない(また値段に質が合っていない)。「中学生は35人のうち18人が「満足」と答え、高校生は29人のうち14人が「満足」と回答していますから、前者は約0.51、後者は約0.52となり、高校生グループの方が「満足」と回答する割合が少しだけ高くなっています」(179頁)という一節を著者が書き(しかも、15を14と書き間違えたのではなく実際にデータは14)、編集者も気づかないのはおかしい。2025/02/21