やってみようテキストマイニング―自由回答アンケートの分析に挑戦!

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 180p/高さ 22cm
  • 商品コード 9784254122350
  • NDC分類 007.1
  • Cコード C3041

出版社内容情報

フリーソフトとExcelを使って自由回答文アンケートのテキストマイニングに挑戦する入門書。アンケート調査の自由回答文を題材に,フリーソフトKH CoderとExcelを使ってテキストデータの定量分析に挑戦。テキストマイニングの勘所や流れがわかる入門書。〔内容〕分析の手順/データの事前編集/形態素解析/抽出語の分析/文書の分析/他

第1章 テキストマイニングをはじめる
 1.1 テキストマイニングとは 
 1.2 テキストマイニングの手順
  1.2.1 「文書」を「言葉」にばらす――形態素解析
  1.2.2 「言葉」と「言葉」の関係を分析する
 1.3 データ構造の特徴 
 1.4 テキストマイニングのポイント
  1.4.1 データ整理の段階
  1.4.2 検索や分析の段階
  1.4.3 解釈する段階――仮説を立てて要約する
 1.5 事例について 

第2章 データの事前編集
 2.1 外部変数とテキストデータ 
 2.2 有効データの抽出 
 2.3 データの置換 
 2.4 改行コードの編集 

第3章 データの読み込み
 3.1 データファイルの分割 
 3.2 テキスト部のデータの読み込みとファイル形式  
 3.3 前処理
  3.3.1 分析対象ファイルのチェック
  3.3.2 前処理の実行
 3.4 抽出語の暫定的なリスト表示 
 3.5 My辞書の作成
  3.5.1 複合語の検出とMy辞書の作成
  3.5.2 語の取捨選択
 3.6 前処理の再実行 
 3.7 外部変数の読み込み 

第4章 第1段階の分析1:抽出語の分析
 4.1 抽出語全体のリスト表示と集計
  4.1.1 [抽出語リスト]――抽出語を頻度順に並べる
  4.1.2 [記述統計]――抽出語の基本的な集計を行う
 4.2 抽出語のさまざまな検索
  4.2.1 [抽出語検索]――抽出語の詳細な情報を表示する
  4.2.2 [KWICコンコーダンス]――文脈内で抽出語を一覧する
  4.2.3 [関連語検索]――共起性に基づく関連語を検索する
 4.3 抽出語の分析
  4.3.1 共通の手続き:抽出語の選択と調整ボタン
  4.3.2 [対応分析]――クロス集計を視覚化する
  4.3.3 [多次元(構成)法]――抽出語どうしの共起関係を視覚化する
 4.3.4 [階層的クラスター分析]――似たものどうしをグループ化する
  4.3.5 [共起ネットワーク]――共起関係のネットワークを描写する
  4.3.6 [自己組織化マップ]――抽出語を自動分類する

第5章 第1段階の分析2:文書の分析
 5.1 [文書検索]――抽出語の組み合わせで文書を検索する
  5.1.1 検索条件の設定
  5.1.2 結果の表示方法
  5.1.3 文書(サンプル)の詳細表示
 5.2 [クラスター分析]――類似の回答をグループ化する
  5.2.1 クラスター分析のオプション設定
  5.2.2 クラスター別文書数と併合過程
  5.2.3 クラスター別文書検索と特徴後語の表示

第6章 第2段階の分析:仮説検証的な分析
 6.1 仮説をコーディングする
  6.1.1 仮説たてる
  6.1.2 仮説をコード化する
 6.2 仮説コードの集計と分析
  6.2.1 仮説コードの集計
  6.2.2 仮説コードの分析
 6.3 再び文書検索/コード化できなかった文書を追跡する 
 6.4 コーディング結果の出力と利用法 

第7章 テキストマイニングの事例
 7.1 高齢者向けサービスのまとめ 
 7.2 来街者による街の評価 
 7.3 週報データの分析 
 7.4 公的統計におけるコメントの分析 

付録A データ編集の補足
 A.1 Excelマクロによる一括変換 
 A.2 改行コードの編集 

付録B Excelマクロによる外部変数と抽出語のクロス集計
 B.1 クロス集計用Excelデータ 
 B.2 クロス集計の実行 
  B.2.1 データの貼りつけ
  B.2.2 集計指示表の作成と実行
  B.2.3 集計結果の表示
 B.3 「外部変数と見出し」の利用 
  B.3.1 外部変数の特定の値(カテゴリー)の特徴語
  B.3.2 外部変数の特徴語一覧

付録C ベイズ学習による分類
 C.1 ベイズの定理とテキストマイニングへの応用 
 C.2 外部変数からの学習 
 C.3 学習結果を用いた自動分類

索引

●コラム目次
 1 KH Coderについて 
 2 HTMLマーキング 
 3 抽出語に関する注意事項とKH Coderの品詞体系 
 4 共起性の尺度
 5 サブグラフ 

牛澤 賢二[ウシザワ ケンジ]
著・文・その他

内容説明

本物のアンケートデータを分析しながらテキストマイニングの勘所を学ぶ。

目次

第1章 テキストマイニングをはじめる
第2章 データの事前編集
第3章 データの読み込み
第4章 第1段階の分析1:抽出語の分析
第5章 第1段階の分析2:文書の分析
第6章 第2段階の分析:仮説検証的な分析
第7章 テキストマイニングの事例
付録A データ編集の補足
付録B Excelマクロによる外部変数と抽出語のクロス集計
付録C ベイズ学習による分類

著者等紹介

牛澤賢二[ウシザワケンジ]
1952年山形県長井市に生まれる。1976年東京理科大学理学部応用数学科卒業。2002年産業能率大学教授。現在、株式会社シード・プランニング顧問。有限会社統計科学研究所理事。博士(工学)(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

Tadashi_N

26
事前の仕込みが適切ならば、文章の傾向を可視化するための強力なツールになる。2019/02/20

晩鳥

2
本書で使っているKH coderは古いバージョンであるようなので、操作など多少違うところはあるが参考になる。コーディングの説明が分かりやすかった。テキストマイニングの事例が載っているのもよかった。2023/12/24

Shuuya Hoshino

1
介護サービスのお客様満足度調査の自由記述の分析に従事したことがある。ケアマネジャーも、自由記述では「ケアマネ―ジャー」「ケア―マネジャー」「ケアマネ」「ケアマネジャー様」「ケアマネさん」「ケア・マネジャー」など多種多様な表現で登場するので、テキストデータを単にソフトにかけるだけではつまずいてしまう。何度も何度もテキストデータに戻って、拾うべき言葉やコード―複数の言葉をテーマや内容によりまとめたもの―を決めて集計や分析をしていくことで、ようやくデータからメッセージが浮かび上がってきて、手応えを感じる。2021/06/04

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/13031080
  • ご注意事項