シリーズ確率と情報の科学
高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 176p/高さ 22cm
  • 商品コード 9784000069748
  • NDC分類 007.6
  • Cコード C3341

出版社内容情報

文書,ウェブ上の情報,ゲノム配列,センサデータなど,多様な情報が「文字列」として表現される.そのデータ量は爆発的に増加しており,多くの分野で,より高度で高速な解析技術が求められている.本書では文字列解析に有用な理論,データ構造,アルゴリズムと,それをふまえたデータの圧縮,検索,分析の実践手法を紹介する.

内容説明

文書、ウェブページ、ゲノム配列、センサデータ、行動履歴など、多様な情報が「文字列」として表現される。そのデータ量は近年、爆発的に増加しており、多くの分野で、より高度で高速な解析技術が求められている。本書では文字列解析に有用な理論、データ構造、アルゴリズムと、それをふまえたデータの圧縮、検索、分析の実践手法を紹介する。

目次

第1章 文字列解析の今
第2章 文字列解析の準備
第3章 Burrows Wheeler変換
第4章 簡潔データ構造
第5章 ウェーブレット木
第6章 文字列データ圧縮
第7章 全文検索
第8章 テキストマイニングのためのデータ構造

著者等紹介

岡野原大輔[オカノハラダイスケ]
1982年生まれ。2010年3月、東京大学大学院情報理工学系研究科コンピュータ科学専攻博士課程を修了、情報理工学博士。2006年3月に(株)Preferred Infrastructureを共同で創業、現在、同社取締役副社長。主な受賞歴は、IPA未踏ソフトウェア創造事業スーパークリエータ認定(2005年)、東京大学総長賞(2007年)、言語処理学会年次大会優秀発表賞(2009年、2010年)など(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

kinaba

0
こういうの確かに今の時代によく使われるアルゴリズムの基礎といっていいと思うけど、なかなか伝統的な教科書にはまだまだない。簡潔に今なにができるのか、がまとまっていてよかった2013/09/23

ななみ

0
高々140ページ程度の本だけど、想像以上に読むのに時間が掛かった! 文字列にからむいろんな話題が実に簡潔にまとめられていて、見かけより中身がずっと濃い…というのは、まさに本書のターゲットのひとつである文字列の圧縮技術を彷彿とさせる。この内容をそのまま検索、理解できる人には手近なハンドブックになるのだろうけど、私のようなレベルではいちいち復元してから読み解く必要があるので時間が掛かる。これも文字列圧縮と似ているかな。いろんな意味で興味深く、勉強になる本。2013/06/21

Masahiro Sato

0
昨年末に発売された本書。今後、文字列解析のバイブルになるのかな。データ構造の一種であるウェーブレット木という名称をこの本で初めて知った。Wikipedia によるとウェーブレット変換に準えて名付けられたようだけど、元の意味を考えるとサブバンド木の方が名称として適切な気がする。 ニコニコ生放送タイムシフトで観ようと思ってたけどすっかり忘れてた。 http://live.nicovideo.jp/watch/lv120540885 http://research.preferred.jp/2013/01/w2013/02/09

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/5672955
  • ご注意事項

最近チェックした商品