シリーズ確率と情報の科学 統計的テキストモデル―言語へのベイズ的アプローチ

個数：

電子版価格
¥5,060

電子版あり

シリーズ確率と情報の科学
統計的テキストモデル―言語へのベイズ的アプローチ

持橋大地【著】
価格 ¥5,060（本体¥4,600）
岩波書店（2025/06発売）
ポイント 46pt

ウェブストアに23冊在庫がございます。（2025年12月11日 04時52分現在）
通常、ご注文翌日～2日後に出荷されます。
出荷予定日とご注意事項
※上記を必ずご確認ください

【ご注意事項】 ※必ずお読みください
◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
◆事情により出荷が遅れる場合がございます。
◆お届け日のご指定は承っておりません。
◆「帯」はお付けできない場合がございます。
◆画像の表紙や帯等は実物とは異なる場合があります。
◆特に表記のない限り特典はありません。
◆別冊解答などの付属品はお付けできない場合がございます。
●3Dセキュア導入とクレジットカードによるお支払いについて
●店舗受取サービス（送料無料）もご利用いただけます。
ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら

サイズ A5判／ページ数 400p／高さ 21cm
商品コード 9784000069762
NDC分類 007.1
Cコード C3341

出版社内容情報

文字・単語・文・文書からなる離散データをベイズ統計モデルでいかに学習するか。さまざまなテキストの統計的なモデル化の数理について一から説明し、ブラックボックスに頼らずとも自分の手で統計的分析を駆使できるようになることを目指す。分野を問わず自然言語処理の必要性が増加の一途をたどるなか、読者を基礎から導く好適書。

【目次】

　はじめに
　本書の記法

1　テキストと言語のモデル化
　1．1　言語とテキストの特徴
　1．2　テキストの階層構造
　1．3　教師あり学習と教師なし学習
　1．4　統計的な方法とヒューリスティックな方法
　1．5　本書の概要と読み方
　1．6　本書の例と実装について
　1章の文献案内

2　文字の統計モデル
　2．1　文字の頻度と出現確率
　2．2　文字の同時確率
　2．3　同時確率の周辺化
　2．4　文字の条件つき確率
　　2．4．1　確率の連鎖則
　　2．4．2　ベイズの定理
　2．5　文字nグラムモデル
　　2．5．1　文字列の確率的生成
　　2．5．2　ゼロ頻度問題
　2．6　統計モデルの学習と評価
　　2．6．1　学習データとテストデータ
　　2．6．2　テキストの確率の計算
　　2．6．3　情報理論の基礎
　　2．6．4　統計モデルと汎化性能
　2章の演習問題
　2章の文献案内

3　単語の統計モデル
　3．1　文字から単語へ
　3．2　単語の統計と羃乗則
　　3．2．1　Heapsの法則
　　3．2．2　Zipfの法則
　3．3　単語の統計的フレーズ化
　3．4　単語nグラム言語モデル
　　3．4．1　ディリクレ分布
　　3．4．2　ディリクレ分布と多項分布
　　3．4．3　ハイパーパラメータαの推定
　　3．4．4　階層ディリクレ言語モデル
　　3．4．5　Kneser-Ney言語モデル
　3．5　単語ベクトルとその原理
　　3．5．1　ニューラルnグラム言語モデル
　　3．5．2　Word2Vecによる単語ベクトル
　　3．5．3　単語ベクトルの学習
　　3．5．4　Word2Vecと行列分解
　　3．5．5　GloVeと意味方向の数理
　　3．5．6　単語ベクトルの分布とノルム
　3章の演習問題
　3章の文献案内

4　文の統計モデル
　4．1　テキストの文分割
　4．2　文ベクトルと意味的ランダムウォーク
　　4．2．1　RAND-walkモデル
　　4．2．2　文ベクトルの計算
　4．3　構文解析と係り受け解析
　4．4　隠れマルコフモデル(HMM)
　　4．4．1　HMMの状態推定
　　4．4．2　HMMのパラメータ推定
　　4．4．3　周辺化Gibbsサンプリング
　　4．4．4　HMMによる品詞の教師なし学習
　4章の演習問題
　4章の文献案内

5　文書の統計モデル
　5．1　ナイーブベイズ法と単語集合表現
　　5．1．1　文書の分類確率
　5．2　ユニグラム混合モデル(UM)
　　5．2．1　トピックの解

内容説明

１　テキストと言語のモデル化（言語とテキストの特徴；テキストの階層構造　ほか）
２　文字の統計モデル（文字の頻度と出現確率；文字の同時確率　ほか）
３　単語の統計モデル（文字から単語へ；単語の統計と冪乗則　ほか）
４　文の統計モデル（テキストの文分割；文ベクトルと意味的ランダムウォーク　ほか）
５　文書の統計モデル（ナイーブベイズ法と単語集合表現；ユニグラム混合モデル（ＵＭ）　ほか）

著者等紹介

持橋大地［モチハシダイチ］
１９７３年生まれ。１９９３年東京大学文科三類入学、２００５年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。博士（理学）。ＡＴＲ音声言語コミュニケーション研究所、ＮＴＴコミュニケーション科学基礎研究所各研究員を経て、２０２４年より統計数理研究所　統計基盤数理研究系教授／総合研究大学院大学　統計科学コース教授および国立国語研究所　次世代言語科学研究センター教授（兼務）。専門は自然言語処理および統計的機械学習（本データはこの書籍が刊行された当時に掲載されていたものです）
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ドワンゴの提供する「読書メーター」によるものです。

mim42

深層学習時代前夜まではフォロワーも少なくなかったトピック。言語のような系列データに関する教師なし学習モデリングの教科書。個人的に懐かしい話題であり期待して読み進めた。基本的に説明が些細で助かったのだが、大局的な説明がなくつらい箇所も。式展開でももう少し説明が欲しいところが散見。とはいえそれらは主に私のベイズ脳の化石化によるところも大。有用性の面では、何らかの事情で生成AIが利用不可等の特殊な事情があるケースでは即戦力となり、かつLLMエージェント連結ツールとしての道もありそう。2025/10/01

レビューを書く、レビューをもっと見る

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/22681582

ご注意事項

ご注意
リンク先のウェブサイトは、株式会社ドワンゴの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
最新のアドレスについては、お客様ご自身でご確認ください。
リンク先のウェブサイトについては、「株式会社ドワンゴ」にご確認ください。

閉じる