KS情報科学専門書<br> 実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門

個数:1
紙書籍版価格
¥2,860
  • 電子書籍
  • Reader

KS情報科学専門書
実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門

  • ISBN:9784065274101

ファイル: /

内容説明

★基礎技術と分析アプローチがわかる入門書の決定版!★

・「spaCy+GiNZA」による一気通貫の分析がすぐに実践できる
・観光/金融・経済/ソーシャルメディアの分析事例をていねいに解説
・つまずきやすい「環境構築」もしっかりサポート

【本書はこんな人におすすめです】
・Pythonの基本が身についたので、次はテキストアナリティクスを学んでみたい
・大学の講義やプログラミングスクールなどで自然言語処理について少し触れたが、もう少し詳しく学びたい
・テキストアナリティクスにつまずいたことがあったり、ブランクがあったりして再挑戦してみたい


【本書「巻頭言」より抜粋】
アイディア次第でさまざまな分析が可能になるのがテキストアナリティクスの面白さです.その反面,多くの場合,簡単に結果が出るものではありません.諦めずに試行錯誤を続けることが重要です.基本的には多様な可能性に思いを巡らせることが有効です.それには経験の蓄積が活きてきますので,やればやるほど成果を出しやすくなります.自分で実際にデータを処理し,試行錯誤をしてみるのがテキストアナリティクスのスキルを向上させる近道です.その考えから,本書では試してみることを重要視しています.
――那須川哲哉(日本アイ・ビー・エム株式会社東京基礎研究所主席研究員)


【サポートページ】
https://github.com/tksakaki/kspub_ds_text_analytics


【主な内容】
第I部 テキストアナリティクスの基礎
第1章 テキストアナリティクスことはじめ
第2章 プログラミングの補足知識
第3章 環境構築
第4章 基礎技術
 
第II部 テキストアナリティクスの実践
第5章 データ収集
第6章 観光テキストの解析
第7章 金融・経済テキストの解析
第8章 ソーシャルメディアテキストの解析

第III部 応用技術・発展的な内容
第9章 実践的なテクニック
第10章 深層学習技術
第11章 環境構築の要らないテキストアナリティクス

付録 本書で利用するPythonライブラリ


【編著者紹介】
榊 剛史
株式会社ホットリンク 開発本部R&D 部長
東京大学未来ビジョン研究センター 客員研究員
中国・清華大学による世界的なAI研究者2000人に選出。2006年電力会社にて情報通信業務に従事した後、東京大学博士課程に入学。2013年松尾研究室にて博士号取得。2015年~株式会社ホットリンクに入社。

目次

第I部 テキストアナリティクスの基礎
第1章 テキストアナリティクスことはじめ
1.1 テキストアナリティクスとは?
1.2 分析のためのアプローチ
1.3 分析のための基盤技術
1.4 まとめ:自然言語処理を学ぶために
第2章プログラミングの補足知識
2.1 文字コード
2.2 ファイルの入出力
2.3 正規表現
<note>正規表現のテスト・可視化方法
2.4 内包表記
2.5 まとめ:Pythonを使いこなすために
第3章 環境構築
3.1 Linux
3.2 macOS
3.3 Windows
3.4 Pythonの仮想環境
<note>仮想環境の必要性
3.5 まとめ:より快適な環境を構築するために
第4章 基礎技術
4.1 基礎的な解析
<note>spaCyの基本的な考え方
4.2 文書の分類・クラスタリング
4.3 可視化
<note>単語共起行列の計算
4.4 まとめ:より深い分析を実現するために
第II部 テキストアナリティクスの実践
第5章 データ収集
5.1 公開データ
5.2 社内データ
5.3 データ購入
5.4 ウェブクローリング
第6章 観光テキストの解析
6.1 データの入手:観光テキスト解析に利用できるソーシャルメディアの例
6.2 口コミを利用した観光地の分析
6.3 口コミを利用したテーマパークの分析
6.4 分析上の注意点
6.5 研究の紹介
第7章 金融・経済テキストの解析
7.1 事前準備:金融・経済における極性分析
7.2 データの入手:金融・経済テキストデータの入手
7.3 基礎的な解析:基礎的なテキスト分析
7.4 分析:有価証券報告書を用いた日経平均予想
7.5 分析上の注意点
7.6研究の紹介
第8章 ソーシャルメディアテキストの解析
8.1 Twitterデータによる世情分析
8.2 2ちゃんねるデータによる世情分析
8.3 大規模データ処理に対する工夫
8.4 研究の紹介
第III部 応用技術・発展的な内容
第9章 実践的なテクニック
9.1 単語処理に関するテクニック
9.2 その他のツールの比較と利用方法
9.3 まとめ
<note>根性マイニング
第10章 深層学習技術
10.1 単語分散表現
10.2 文分散表現
10.3 BERTをはじめとするTransformerモデルの利用
10.4 まとめ
第11章 環境構築の要らないテキストアナリティクス
11.1 Google Colaboratoryを利用したテキストアナリティクス
11.2 自然言語処理APIを利用したテキストアナリティクス
11.3 まとめ
付録 本書で利用するPythonライブラリ

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

kk

0
GinzaやspaCyを多用したテキストアナリティックスの入門書。いつのまにかこういったツールがどんどん便利になっているなと思いました。データ分析系の研究はしばらく手をだしていないし、今後も特に予定があるわけではないのですが、博士のころのデータマイニングのバイト楽しかったなと思いだしました。また、この頃いただいたコーパスばかり使っているので、データ収集の大変さを思い出しました。そして何よりの感想はNLCの幹事団仲よさそうでうらやまし...ということでした(汗)。2023/01/20

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/19410863
  • ご注意事項