内容説明
本書は,ディジタルメディアの代表的データである画像や音声をコンピュータで扱うための基本的な手法を知り,実際に読者がPythonを用いて様々な処理ができるようになることを目標としている。
目次
1. 簡単な音声処理
1.1 波形データの生成
1.2 1次元データの可視化
1.3 時間波形の重ね合わせ
1.4 時間波形の連結
1.5 読み込んだ音声データの加工
章末問題
2. 簡単な画像処理
2.1 画像の構造
2.2 画像・ビデオの読み込み
2.3 領域の抽出
章末問題
3. 音声のフーリエ変換
3.1 フーリエ変換
3.2 窓関数
3.3 音声のフレーム処理
3.4 逆フーリエ変換
章末問題
4. フィルタ(音声)
4.1 線形フィルタ
4.1.1 線形システム
4.1.2 遅延演算
4.1.3 移動平均フィルタ
4.2 インパルス応答
4.3 IIRフィルタ
4.4 フィルタ設計のツール
章末問題
5. 画像の周波数領域処理
5.1 空間周波数
5.2 2次元フーリエ変換
5.3 周波数領域でのフィルタ処理
5.4 周波数領域での画像の拡大
章末問題
6. 画像の空間領域処理
6.1 2次元畳み込み
6.2 微分演算
6.3 エッジの検出
6.4 非線形フィルタ
章末問題
7. 音声データの相関
7.1 相互相関
7.1.1 ベクトルの類似度
7.1.2 相互相関関数
7.2 自己相関
7.3 時間波形のフレーム処理
章末問題
8. 画像データの類似度
8.1 画素のユークリッド距離
8.2 画素の相関の応用
8.3 領域の相関
章末問題
9. 複素信号
9.1 信号の複素指数関数表現
9.2 周波数変調
9.2.1 瞬時周波数
9.2.2 周波数変調
9.2.3 任意の音の周波数変調
章末問題
10. 画像の幾何学的処理
10.1 2次元平面上の回転
10.2 2次元平面上の平行移動
10.3 同次座標表現を用いた変換
10.4 アフィン変換
10.5 射影変換
10.6 複雑な形状の変換
章末問題
11. 分類
11.1 特徴量
11.1.1 短時間エネルギー
11.1.2 零交差
11.2 k最近傍分類
11.3 最尤法
章末問題
12. 音声・画像処理の応用
12.1 Wavetable合成
12.1.1 ADSRエンベロープ
12.1.2 楽器音からの波形データの抽出
12.1.3 複数のテンプレートを用いた合成
12.1.4 長さの変更
12.1.5 リサンプルによるピッチの変更
12.2 衛星画像の時間変化領域の解析
章末問題
章末問題ヒント
索引
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
R
mondo
yyhhyy