内容説明
信号処理のうち音声・音響に焦点を絞り,おもにフィルタ,ノイズ除去,音響エフェクトの原理について解説した。特に音響エフェクトの原理について,機械学習による音質変換とは異なり,物理モデルに基づく基本的手法を押さえている。
目次
1.音で復習する信号処理の基礎
1.1 ディジタル信号とフィルタ
1.1.1 ディジタル信号
1.1.2 確率信号の記述について
1.1.3 ディジタルフィルタ
1.1.4 フィルタの構成要素
1.1.5 FIRフィルタとIIRフィルタ
1.1.6 FIRフィルタのインパルス応答
1.2 FIRフィルタの設計
1.2.1 直線位相FIRフィルタの設計
1.2.2 低域通過フィルタ(LPF)の設計
1.2.3 高域通過フィルタ(HPF)の設計
1.2.4 帯域通過フィルタ(BPF)の設計
1.3 ノッチフィルタの設計
1.3.1 IIRフィルタのインパルス応答
1.3.2 IIRフィルタとFIRフィルタの接続
1.3.3 オールパスフィルタ
1.3.4 ノッチフィルタ
1.4 離散フーリエ変換
1.4.1 z変換
1.4.2 フィルタとz変換の関係
1.4.3 離散時間フーリエ変換
1.4.4 離散フーリエ変換
1.5 窓関数
1.5.1 矩形窓
1.5.2 ハン窓
1.5.3 その他の窓関数
1.6 STFTとオーバラップ加算
1.6.1 ハーフオーバラップ
1.6.2 STFTの冗長性
1.6.3 位相スペクトルの復元
2.発声モデル
2.1 ソース・フィルタモデル
2.1.1 音声の発声の仕組み
2.1.2 音源と声道フィルタ
2.1.3 音声のソース・フィルタモデル
2.1.4 微細構造とスペクトル包絡
2.1.5 基本周期と基本周波数
2.2 線形予測分析
2.2.1 予測誤差フィルタ
2.2.2 音声の合成
2.2.3 レビンソン・ダービンアルゴリズム
2.2.4 フォルマント
2.3 ケプストラム分析
2.3.1 ケプストラム
2.3.2 スペクトル包絡
3.スペクトログラム
3.1 スペクトログラムの生成
3.1.1 オーバラップとスペクトログラム
3.1.2 スペクトログラムの行列表現
3.2 スペクトログラムからの音合成
3.2.1 位相スペクトルによる合成音の違い
3.2.2 反復位相復元
3.3 画像の音変換
3.3.1 画像音響変換
3.3.2 画像からの合成音生成
3.3.3 合成音のスペクトログラム
3.3.4 オーバラップを含む場合の合成音
3.3.5 ISTFT以外でつくる画像の音
3.4 音で画像を描く
3.4.1 垂直線の描画
3.4.2 水平線の描画
3.4.3 点の描画
4.周波数分析に基づくノイズ除去
4.1 単一マイクロホンによるノイズ除去システム
4.1.1 スペクトルゲインによるノイズ除去
4.1.2 スペクトル減算法
4.1.3 ウィーナーフィルタ
4.1.4 判定指向法
4.2 事後確率最大化によるノイズ除去
4.2.1 事後確率
4.2.2 MAP推定法
4.2.3 MAP推定によるウィーナーフィルタの導出
4.2.4 その他のMAP推定によるスペクトルゲイン
4.2.5 ノイズ除去結果の比較
4.3 音源の分離
4.3.1 音源位置と観測信号の関係
4.3.2 会話音声の性質
4.3.3 バイナリマスキング
5. 適応フィルタ
5.1 システム同定
5.1.1 システム同定の構成
5.1.2 評価関数の設定
5.1.3 フィルタ係数の最適値
5.1.4 適応アルゴリズム
5.1.5 最急降下法
5.1.6 LMSアルゴリズム
5.1.7 NLMSアルゴリズム
5.2 フィードバックキャンセラ
5.2.1 音のループが生じる環境
5.2.2 エコーキャンセラ
5.2.3 フィードバックキャンセラ
5.3 適応線スペクトル強調器
5.3.1 適応線スペクトル強調器の原理
5.3.2 ALEによる音声の白色雑音除去
5.3.3 ALEによる音声の正弦波ノイズ除去
5.4 突発ノイズ除去
5.4.1 正弦波に対する線形予測
5.4.2 線形予測器による正弦波信号の補間
5.4.3 音声の突発ノイズ除去
6.音響エフェクト
6.1 エコー
6.1.1 エコーの定式化
6.1.2 ディレイ
6.1.3 リバーブ
6.2 正弦波の乗算によるボイスチェンジャ
6.2.1 正弦波の乗算
6.2.2 正弦波乗算の効果
6.2.3 折り返し歪みの影響
6.2.4 音声に正弦波を乗じた結果
6.3 リングバッファによるボイスチェンジャ
6.3.1 リングバッファ
6.3.2 音の高さの変更
6.3.3 音声に対するリングバッファの長さ
6.3.4 リングバッファによるボイスチェンジャ
6.3.5 リングバッファの不連続性を回避する方法
6.3.6 不連続性を回避したボイスチェンジャの実現
6.4 話速変換とピッチシフタ
6.4.1 リサンプリング
6.4.2 もとの信号とリサンプリング後の信号の対応関係
6.4.3 ディジタル信号から連続時間信号への変換
6.4.4 リサンプリングの実現
6.4.5 音声の周期を利用した話速変換
6.4.6 話速を速くする方法
6.4.7 話速を遅くする方法
6.4.8 ピッチシフタ
6.5 ヘリウムボイス
6.5.1 音速と波長
6.5.2 声道の共鳴周波数と音速の関係
6.5.3 スペクトル包絡の伸縮
6.5.4 ヘリウムボイスの実現
6.6 コンプレッサ
6.6.1 コンプレッサの基本構成
6.6.2 ガンマ変換によるコンプレッサ
6.6.3 ノイズゲート
6.6.4 ディストーション
6.7 その他の音響エフェクト
6.7.1 トレモロ
6.7.2 ビブラート
6.7.3 コーラス
引用・参考文献
索引
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
vinlandmbit
株式会社 コロナ社