KS情報科学専門書<br> 音声変換入門―Pythonで作って学ぶボイスチェンジャー

個数:
電子版価格
¥3,960
  • 電子版あり
  • ポイントキャンペーン

KS情報科学専門書
音声変換入門―Pythonで作って学ぶボイスチェンジャー

  • ウェブストアに30冊在庫がございます。(2026年04月26日 16時26分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 272p/高さ 24cm
  • 商品コード 9784065426371
  • NDC分類 501.24
  • Cコード C3055

出版社内容情報

音響学・機械学習の基礎から積み上げ、Diffusion Transformerによる音声変換の実装まで至る。
基礎から最先端まで一気通貫に解説!

《目次》
[第1部 統計的機械学習に基づく音声言語情報処理]
第1章 音声言語情報処理
1.1 音声言語情報処理とは何か
1.2 人間の音声生成
1.3 人間の音知覚
1.4 音声言語データの特徴抽出

第2章 統計的機械学習
2.1 音声から何かを学習するということ
2.2 統計的機械学習の手引き
2.3 分類タスク
2.4 回帰タスク

第3章 深層ニューラルネットワークの基礎
3.1 単純パーセプトロンから多層パーセプトロンへ
3.2 多層パーセプトロンからDNNへ
3.3 深層生成モデル

第4章 実践して学ぶ音声言語情報処理
4.1 Google ColabolatoryでのPythonプログラミング
4.2 多話者音声コーパスのダウンロードと分析
4.3 PyTorchでの深層学習実装

[第2部 統計的音声変換の基礎と応用]
第5章 深層学習による音声変換の基礎
5.1 音声変換の定義と分類
5.2 作って学ぶ深層学習によるパラレル音声変換
5.3 作って学ぶ深層学習によるノンパラレル音声変換

第6章 音声変換を取り巻く技術と社会的側面
6.1 処理タイミングによる音声変換の分類
6.2 変換対象話者の指定方法による音声変換の分類
6.3 変換先話者の学習データ量による分類
6.4 社会への影響
6.5 法的な視点

第7章 正規化フローに基づく音声変換
7.1 FreeVCの概要と特徴
7.2 FreeVCのアーキテクチャ
7.3 事前エンコーダ
7.4 事後エンコーダと潜在変数zの推定
7.5 デコーダと波形出力
7.6 話者エンコーダ
7.7 音声変換モデル全体
7.8 識別器
7.9 スペクトログラムリサイズによるデータ拡張
7.10 訓練手順と損失関数
7.11 推論時の流れ

第8章 拡散モデルに基づく音声変換モデル
8.1 ゼロショット音声変換
8.2 SeedVCの特徴と強み
8.3 拡散トランスフォーマー
8.4 フローマッチング
8.5 SeedVCの学習と推論


【目次】

内容説明

理論から実践まで/基礎から最先端まで一気通貫!音響学・機械学習の初歩からはじまり、Diffusion Transformerによる音声変換の実装まで至る!

目次

第1部 統計的機械学習に基づく音声言語情報処理(音声言語情報処理;統計的機械学習;深層ニューラルネットワークの基礎;実践して学ぶ音声言語情報処理)
第2部 統計的音声変換の基礎と応用(深層学習による音声変換の基礎;音声変換を取り巻く技術と社会的側面;正規化フローに基づく音声変換;フローマッチングに基づく音声変換)

著者等紹介

齋藤佑樹[サイトウユウキ]
博士(情報理工学)。東京大学大学院情報理工学系研究科 講師。2014年に釧路工業高等専門学校を卒業。2016年に同高専専攻科を修了。2021年に東京大学大学院情報理工学系研究科博士課程を修了。2024年より現職。統計的機械学習理論に基づく音声合成・声質変換の研究に従事

中村泰貴[ナカムラタイキ]
Parakeet株式会社代表取締役 CEO/東京大学大学院博士課程 在籍。2017年に福島工業高等専門学校を卒業。2020年に東京大学工学部を卒業。2022年に東京大学大学院情報理工学系研究科修士課程を修了。2022年にParakeet株式会社を創業。音声合成・声質変換の研究および社会実装に従事(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

最近チェックした商品