目次
第1章 音源分離とは?
第2章 音声処理の基礎
第3章 音源分離で用いる数学的知識の基礎(線形代数、ベクトル・行列の微分)
第4章 「最適化」に関する技法を理解する
第5章 シミュレータで音を作ってみる
第6章 古典的な音源分離方法―ビームフォーミング
第7章 音源方向推定に基づく音源分離
第8章 現代的な統計的モデルに基づく音源分離法
第9章 響きのある音を響きのない音に変える残響除去法
第10章 音源分離と残響除去を統合的に実行する
第11章 音源分離関連のライブラリ紹介・その他のトピック・参考文献
著者等紹介
戸上真人[トガミマサヒト]
2017年1月~2018年5月、スタンフォード大学のStanford Data Science Initiative(SDSI) Visiting Scholar。2018年6月にLINE株式会社入社。現在、同社のAI研究組織であるData LabsのSpeech TeamのManager兼Principal Researcher。(一社)人工知能学会理事。16年以上に渡り、音声処理の研究開発に従事。東京大学工学系研究科より2011年に博士(工学)授与。登録特許20件以上、査読あり国際会議での採択論文数60件以上。IEEE Senior Member(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
yyhhyy
3
タイトル通りの内容。音声処理をPythonで紹介する本は希少。2022/02/05
smatsu
0
ガチな内容でちょっと今の自分には難しすぎた。音源分離というのは話し声、背景雑音、残響などが混ざった音から不要な音を除去し目的の音を聞き取りやすくする技術。いわゆるノイズキャンセリングで音声認識の前処理としても重要。普通のフーリエ変換は対象の信号が時系列で変化することを想定していないので短時間で区切ってそのフレームごとにフーリエ変換する短時間フーリエ変換(STFT)という技術を使う。スペクトログラムを用いて音声を視覚化し雑音除去を行う。その先へ進むのに必要な数学知識も説明されているがなかなかきびしい…2025/05/06