出版社内容情報
文書,ウェブ上の情報,ゲノム配列,センサデータなど,多様な情報が「文字列」として表現される.そのデータ量は爆発的に増加しており,多くの分野で,より高度で高速な解析技術が求められている.本書では文字列解析に有用な理論,データ構造,アルゴリズムと,それをふまえたデータの圧縮,検索,分析の実践手法を紹介する.
内容説明
文書、ウェブページ、ゲノム配列、センサデータ、行動履歴など、多様な情報が「文字列」として表現される。そのデータ量は近年、爆発的に増加しており、多くの分野で、より高度で高速な解析技術が求められている。本書では文字列解析に有用な理論、データ構造、アルゴリズムと、それをふまえたデータの圧縮、検索、分析の実践手法を紹介する。
目次
第1章 文字列解析の今
第2章 文字列解析の準備
第3章 Burrows Wheeler変換
第4章 簡潔データ構造
第5章 ウェーブレット木
第6章 文字列データ圧縮
第7章 全文検索
第8章 テキストマイニングのためのデータ構造
著者等紹介
岡野原大輔[オカノハラダイスケ]
1982年生まれ。2010年3月、東京大学大学院情報理工学系研究科コンピュータ科学専攻博士課程を修了、情報理工学博士。2006年3月に(株)Preferred Infrastructureを共同で創業、現在、同社取締役副社長。主な受賞歴は、IPA未踏ソフトウェア創造事業スーパークリエータ認定(2005年)、東京大学総長賞(2007年)、言語処理学会年次大会優秀発表賞(2009年、2010年)など(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
kinaba
ななみ
Masahiro Sato