正規表現とテキスト・マイニング―情報発見のツール・キット

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 308p/高さ 21cm
  • 商品コード 9784750318004
  • NDC分類 007.5
  • Cコード C0000

出版社内容情報

カオス化するインターネット情報の中から、重要な学術資源や技術情報を発見するための手法を紹介。情報の検索・収集から、その処理・活用や文書情報の要約、そして新情報の発見や知識の構築まで、情報技術を活用して実現できる実践的な方法論を図解する。

1 情報の収集と検索
 1-1 パソコンに図書館が収まる時代が来た
 1-2 インターネットの情報水脈
 1-3 サイトの情報を全部取り込もう
 1-4 インターネットから百科事典を集めよう
 1-5 自前で作るデータベース
 1-6 電子情報倉庫は整理無用
 1-7 縮小印刷で高密度情報ファイルを作成
 1-8 パーソナル・データベースの構築

2 情報発見の技術
 2-1 「情報」と「電子情報」との違い
 2-2 文字列パターン発見の技術「正規表現」
 2-3 正規表現の記述法の改善
 2-4 正規表現を組み込んだサーチエンジン
 2-5 正規表現とテキスト・マイニング

3 秀丸エディタで正規表現を使う
 3-1 秀丸の正規表現(メタキャラクタ)
 3-2 grep検索
 3-3 OR検索
 3-4 AND検索
 3-5 タグジャンプ
 3-6 高度な検索例――判断情報の発見
 3-7 正規表現を使ったテキスト処理

4 MS WORDを活用したテキスト・マイニング
 4-1 テキスト・マイニングとワード・プロミナンス
 4-2 MS WORDのワイルド・カード
 4-3 キーワードをビジュアルに表示する
 4-4 キーワードを取り出す<

パソコンとインターネットの普及に伴って、多量の情報をたやすく入手することができるようになりました。しかし同時に、情報の氾濫という事態にも直面しています。電子メールで回ってくる電子文書の洪水に悩まされているホワイトカラー、ますます高度になる技術開発に必要な情報をどのように集め、開発に生かしたらよいのか、悩んでおられる技術者の方など、多くの人が、電子情報の有効な取り扱い手法を求めています。膨大な電子情報を要領よくさばいて役立てることが、情報化社会のなかでたいへん重要になっているのです。

インターネットは大規模な商業的利用のために雑多な情報が渦巻くカオスと化しました。情報洪水のために、重要な学術資源や技術情報は見つけるのが難しくなっています。そのため、雑情報という海のなかに、学術・技術の水脈を発見するための手法が必要となっています。情報の検索・収集だけではなく、情報の処理・活用や文書情報の要約、そして新情報の発見や知識の構築、これらを、情報技術 Information Technologyを活用して実現できる実践的な方法論の確立が求められています。

ところが、プログラミング技術や応用ソフトなどの解説書はたくさん出版されていまは、いくつかの実践的手法を提案します。情報の検索・収集・発見・活用のための実践的な手法、これらについて解説をします。(後略)

はじめに 佐良木昌

内容説明

情報の検索・収集・発見・活用のための実践的手法を解説。情報活用について知りたい社会人から情報検索のプロを目指す人まで。

目次

1 情報の収集と検索
2 情報発見の技術
3 秀丸エディタで正規表現を使う
4 MS WORDを活用したテキスト・マイニング
5 KWIC検索
6 「KWIC検索+正規表現」でテキスト・マイニング
7 プロセス知と情報技術
追補(述語論理;正規表現と有限状態オートマトン)

著者等紹介

佐良木昌[サラキマサシ]
日本大学経済学部非常勤講師。南クィーンズランド大学大学院修了

新田義彦[ニッタヨシヒコ]
日本大学経済学部教授。スタンフォード大学大学院修了
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

青縁眼鏡

1
仕事で役に立ちそう。2014/03/24

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/1718548
  • ご注意事項

最近チェックした商品