出版社内容情報
AWK言語による、言語研究のための数値データ処理のプログラミング用テキスト。多くの課題と、参考文献の紹介、またテキスト処理を使った言語研究のレポートの例も収録した。(フロッピーディスク付)
内容説明
本書は文字の連続データを対象とします。外国語研究で、ある程度の長さを持った本文のテキストをコーパスと呼びます。このコーパスを用意するには、対象とするテキストをパソコンに入力したり、インターネットなどでダウンロードしたり、また既存のデータを利用したりすることが考えられます。本書では、そのようなテキストデータを例として、その構造化、検索、テンデックス、コンコーダンスなどの手法について説明します。
目次
1 資料・コーパスの作成
2 検索(サーチ)
3 索引(インデックス)
4 文脈付索引(コンコーダンス)
5 文法情報タグ(置換と付加)
6 文字コード