商品詳細
言語において意味を成す最小の要素である「形態素」の解析方法について、技術者向けにその理論や実装方法を網羅的、体系的に解説する。実装や高速化等を扱いつつ、辞書やコーパスなどの言語資源の構築・利用についてもカバー。解析ツールを「ブラックボックス」として使っている人も中身を理解したうえで拡張・改良できる道筋ができ、ひいては独自の辞書の作成を目指せるようになる。C++11を使った具体的な実装方法も掲載。 199
第1章 形態素解析の概要
第2章 言語資源
第3章 テキスト処理の基礎
第4章 辞書引きアルゴリズム
第5章 最小コスト法
第6章 点予測
第7章 未知語処理
第8章 評価
第9章 高度な解析
付録
A.1 条件付き確率場の勾配の導出方法
A.2 logsumexp
著者情報
工藤拓[クドウタク]
1999年京都大学工学部電気電子工学科卒業。2001年奈良先端科学技術大学院大学情報科学研究科博士前期課程修了。2004年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了(工学博士)。2004年NTTコミュニケーション科学基礎研究所リサーチアソシエイト。2005年Google合同会社ソフトウェアエンジニア(本データはこの書籍が刊行された当時に掲載されていたものです)