出版社内容情報
AI等を駆使し、価値ある自然言語テキストを適切に抽出・活用する方法を詳しく解説
本シリーズ第4巻に位置付けられる書。社会の中で日々蓄積されていく電子データの多くは自然言語で書かれたテキストであり、情報社会の伝達手段や知識源として使われている。
これらの情報をデータベースとして整理・構造化し、活用するには、拡散した情報を適切に抽出し関係づける必要がある。このプロセスを(半)自動化する技術が「情報抽出」である。
その際、各分野固有の自然言語表現をいかに的確にとらえて関係づけるかが重要となる。
本書では、固有表現抽出技術と,固有表現間の関係を抽出する関係抽出技術に焦点を当て、機械学習などを駆使して「情報抽出器」を作るための解説を行う。
内容説明
本シリーズでは、“どのようなシステムで、どのような自然言語処理技術が使われているか”“自然言語処理技術によって、どのようなシステムが実現可能か”“自然言語処理技術は、社会とどのようにつながっているか”といった疑問に答えることを念頭に、自然言語処理を使ったアプリやサービスを作るという観点に立って、それらを実現するための理論や技術、および、実装に関するノウハウを示します。
目次
第1章 情報抽出
第2章 情報抽出のためのコーパス作成
第3章 固有表現抽出
第4章 関係抽出
第5章 評価方法
付録
著者等紹介
岩倉友哉[イワクラトモヤ]
2003年株式会社富士通研究所。2011年東京工業大学大学院総合理工学研究科物理情報システム専攻博士課程修了、博士(工学)。2015年‐株式会社富士通研究所主任研究員。2018年‐理化学研究所革新知能統合研究センターユニットリーダー
関根聡[セキネサトシ]
1992年英国マンチェスター大学計算言語学部修士号。1998年ニューヨーク大学コンピューターサイエンス学部博士号。1998‐2007年ニューヨーク大学研究助教授。2000年‐ランゲージクラフト設立。2007年‐ニューヨーク大学研究准教授。2010‐2014年楽天技術研究所ニューヨーク所長。2017年‐理化学研究所革新知能統合研究センターチームリーダー。その他、松下電業産業株式会社(現パナソニック)、ソニーCSL、マイクロソフト研究所などでの研究職を歴任。技術顧問企業多数(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
-
- 和書
- 会社分割ハンドブック