内容説明
本書は、テキストの電子化から始め、テキスト分析のための事前処理、目的に合わせた分析項目の集計方法およびそのテキストの分析方法などについて、例を織り込みながら、テキスト分析に関わる統計的データ処理や機械学習的手法について平易に解説している。テキストにおける法則と指標、テキストの特徴分析、テキストのクラスター分析、テキストの分類分析、テキスト関連の予測や要因分析に分けて、伝統的な方法から最新の方法まで順を追って解説している。
目次
第1章 テキストアナリティクス
第2章 テキストアナリシスのための前処理
第3章 テキストデータの視覚化
第4章 法則と語句の重みおよび特徴語句抽出
第5章 テキストの特徴分析
第6章 テキストのクラスター分析
第7章 テキストの分類と判別分析
第8章 テキストデータによる予測と要因分析
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
愛楊
1
2018年。大体は先程の書籍に内容を増加したバージョンのような感じ。logistic model tree やキャンベラ距離、最大情報量相関係数、確率的潜在空間解析など。2024/12/29
hayataka
1
テキストアナリティクスについて、幅広くトピックがカバーされていて、分析する際の参考になります。具体的には、特徴量の作り方、データ可視化、ネットワーク分析、特徴語句の抽出(TFIDF、情報理論的手法、独立性検定など)、教師なし学習(PCA、コレスポンデイング分析、トピックモデルといった特異値分解やクラスタリング)、教師あり学習(分類問題、回帰問題)といった内容が含まれます。全くの初学者には難しいと思いますが、既にデータマイニングやテキストマイニングを勉強したり、実務で使っている方に良い本だと思います。2021/03/08
contradiction29
0
テキストマイニング分会の素材として学ぶ。機械学習の知見がないとかなり難しい 2021/08/26