自然言語処理シリーズ4 機械翻訳

内容説明

本書では，機械学習および統計的手法に基づいた統計的機械翻訳を中心に解説しながら，その構成要素である複雑な統計モデルに基づいた様々な要素技術について，「どのように実現しているのか」をその基礎的な知識まで詳細に説明した。

1.　機械翻訳
1.1　歴史
　1.1.1　初期の機械翻訳
　1.1.2　ALPACレポート
　1.1.3　実用システム
　1.1.4　データに基づく手法
1.2　知識に基づく機械翻訳
　1.2.1　言語のずれと翻訳の難しさ
　1.2.2　要素合成原理
　1.2.3　翻訳のレベル
　1.2.4　解析
　1.2.5　変換
　1.2.6　生成
　1.2.7　その他の話題
1.3　用例に基づく機械翻訳
　1.3.1　事例ベース推論としての機械翻訳
　1.3.2　用例の検索と修正
　1.3.3　複数用例の利用
　1.3.4　組合せの手がかり
　1.3.5　最適な用例の組合せ
　1.3.6　複雑な組合せ
　1.3.7　今後の発展
1.4　統計的機械翻訳
　1.4.1　暗号解読としての機械翻訳
　1.4.2　モデル
　1.4.3　学習
　1.4.4　デコード
　1.4.5　最適化
1.5　まとめ
章末問題

2.　機械翻訳の評価
2.1　機械翻訳を評価するとは
　2.1.1　機械翻訳の用途
　2.1.2　ブラックボックス評価・ガラスボックス評価
　2.1.3　内的評価・外的評価
2.2　主観評価
　2.2.1　グレード評価（N段階評価）
　2.2.2　一対比較／ランキング
　2.2.3　人間翻訳編集率
　2.2.4　評価者について
　2.2.5　評価の一致
2.3　自動評価
　2.3.1　WER
　2.3.2　TER
　2.3.3　BLEU
　2.3.4　METEOR
　2.3.5　RIBES
　2.3.6　自動評価のメタ評価
2.4　評価結果に基づく差分の検出
　2.4.1　統計的に有意な差
　2.4.2　評価値の信頼区間
　2.4.3　対比較の有意差検定
2.5　まとめ
章末問題

3.　言語モデル
3.1　n-gramモデルの基礎
3.2　n-gramモデルの平滑化
　3.2.1　線形補間
　3.2.2　Witten?Bell法
　3.2.3　絶対割引法
　3.2.4　Kneser?Ney法
　3.2.5　その他の平滑化法
　3.2.6　未定義語への対応
3.3　言語モデルの評価
　3.3.1　尤度・対数尤度
　3.3.2　エントロピー・パープレキシティ
　3.3.3　カバレージ
3.4　学習データと言語モデル性能
3.5　言語モデルの格納・参照
3.6　クラスn-gramモデル
3.7　まとめ
章末問題

4.　単語アライメント
4.1　ヒューリスティックモデル
4.2　IBMモデル
　4.2.1　アライメントに基づくモデル
　4.2.2　稔性に基づくモデル
　4.2.3　学習
4.3　両方向モデル
　4.3.1　ヒューリスティック
　4.3.2　事後確率によるフィルタリング
　4.3.3　学習時の制約
4.4　教師あり単語アライメント
　4.4.1　単語アライメントの評価
　4.4.2　識別学習によるアライメント
4.5　まとめ
章末問題

5.　句に基づく機械翻訳
5.1　句に基づく翻訳モデル
5.2　句に基づくモデルの学習
5.3　対数線形モデル
5.4　デコーダ
　5.4.1　巡回セールスマン問題
　5.4.2　動的計画法に基づくアルゴリズム
　5.4.3　グラフ構造
　5.4.4　半環
　5.4.5　k-bestの導出
　5.4.6　探索空間の制約
　5.4.7　ビーム探索
　5.4.8　ヒューリスティック関数
5.5　フレーズペアの事前並び替え
　5.5.1　事前並び替えルール
　5.5.2　事前並び替えモデル
　5.5.3　事前並び替え学習
5.6　まとめ
章末問題

6.　木構造に基づく機械翻訳
6.1　文脈自由文法
　6.1.1　構文解析
　6.1.2　演繹システム
　6.1.3　超グラフ
　6.1.4　半環構文解析
　6.1.5　k-best導出
6.2　同期文脈自由文法
　6.2.1　同期文脈自由文法の特徴
　6.2.2　同期文脈自由文法の学習
　6.2.3　統語論的ラベルの導入
　6.2.4　素性
　6.2.5　デコーディング
　6.2.6　リスコア
6.3　同期木置換文法
　6.3.1　同期木置換文法の特徴
　6.3.2　同期木置換ルールの学習
　6.3.3　素性
　6.3.4　デコーディング
　6.3.5　二分化
6.4　二言語同期解析
　6.4.1　反転トランスダクション文法
　6.4.2　スパン枝刈り
　6.4.3　ビーム探索
　6.4.4　二段解析
6.5　まとめ
章末問題

7.　最適化
7.1　準備
7.2　バッチ学習
　7.2.1　エラー最小化学習
　7.2.2　確率モデル
　7.2.3　マージン最大化
　7.2.4　ベイズリスク最小化
7.3　オンライン学習
　7.3.1　エラー関数の近似
　7.3.2　学習アルゴリズム
　7.3.3　スパースな素性
　7.3.4　並列化
7.4　まとめ
章末問題

付録　機械翻訳のための資源・ツール
A.1　対訳データ
A.2　文書・文アライメント
A.3　翻訳評価
A.4　言語モデル
A.5　単語アライメント
A.6　機械翻訳システム

引用・参考文献
章末問題解答
索引

感想・レビュー

※以下の感想・レビューは、株式会社ドワンゴの提供する「読書メーター」によるものです。

Nobu A

先月から機械翻訳に関する本3冊目。最初の2冊はMTの歴史や今後の可能性に関するものだが、本著はMTそのものを理解する為のもの。MTの歴史から始まり、各種生成方法の詳細な説明。その後、数式のオンパレード。各章末に問題付きで理解度を確認出来、自然言語処理プログラミングコースでの教科書を想定した構成。数式は正直チンプンカンプン。前著で指摘した誤訳「中間言語/interlingua」が本著からだと判明。既にSLAで使用され、ウィキペディアにも「インターリングア」と表記。本訳出が今後どうなるのか興味津々。2021/05/14

トルネードＧ＆Ｔ

自然言語処理分野における機械翻訳の現時点におけるおそらく唯一であろう教科書。概観・言語モデル・翻訳モデル・評価等が網羅的に解説されている。ただし2014年の書籍のため深層学習による翻訳に関する記述はない。高度な数式や擬似コードも多いため初読である今回は基本的な考え方の理解にのみ焦点を当てて読解。2018/12/06

レビューを書く、レビューをもっと見る

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/7974072

ご注意事項

ご注意
リンク先のウェブサイトは、株式会社ドワンゴの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
最新のアドレスについては、お客様ご自身でご確認ください。
リンク先のウェブサイトについては、「株式会社ドワンゴ」にご確認ください。

閉じる

紀伊國屋書店