KS情報科学専門書<br> つくってわかるPython音声処理プログラミング

個数:
電子版価格
¥3,520
  • 電子版あり

KS情報科学専門書
つくってわかるPython音声処理プログラミング

  • ウェブストアに10冊在庫がございます。(2026年01月01日 12時30分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 336p/高さ 26cm
  • 商品コード 9784065413937
  • NDC分類 547.3
  • Cコード C3004

出版社内容情報


★ありそうでなかった、劇的一冊!!★

・ボイスチェンジャのしくみが根本からわかる、音声処理プログラミングのはじめの一歩!
・博士とマルオ君のやりとりを通して、音の研究の基本が、楽しく学べる!
・簡単なものから順番に、自分の手でプログラムを動かすことが上達への最短コース!

【サポートサイト】
https://floor13.sakura.ne.jp/book10/book10.html

【主な内容】
第1講 周波数特性って、なんですか?
第2講 画像から音って復元できるの?
第3講 重ね合わせれば歌声だってつくれます
第4講 音声って、一体どんな音?
第5講 つくればわかる日本語の音声の特徴
第6講 音声認識がやっていること、ご存じですか?
第7講 音声生成の物理とつながる美しい数学の世界
第8講 音響分析すれば見えてくる音声の特徴
第9講 ボコーダを使えばロボットの声もつくれます
第10講 ボイスチェンジャでカワイイ声をつくるには
第11講 その人の声質で音声合成してみます
第12講 ニューラルネットワークを使ってみよう


【目次】

第1講 周波数特性って、なんですか?
サイン波
フーリエ変換
逆フーリエ変換
重ね合わせの原理
スペクトログラム

第2講 画像から音って復元できるの?
スペクトログラムリーディング
母音を読み取る
破裂音を読み取る
摩擦音を読み取る
破擦音を読み取る
音の推理
グリフィン・リムのアルゴリズム

第3講 重ね合わせれば歌声だってつくれます
Speech to MIDI
MIDIによる音の表現
分析合成
加算合成で音をつくる
音声のロバスト性

第4講 音声って、一体どんな音?
ソースフィルタ理論
声帯音源
声道フィルタ
音声のスペクトログラム
減算合成で音をつくる
音声の自然性

第5講 つくればわかる日本語の音声の特徴
有声音と無声音
破裂音をつくる
摩擦音をつくる
破擦音をつくる
接近音をつくる
弾音をつくる
鼻音をつくる
Motion to Speech

第6講 音声認識がやっていること、ご存じですか?
ケプストラム
フィルタバンク
MFCC
セグメンテーション
DPマッチング

第7講 音声生成の物理とつながる美しい数学の世界
線形予測法
前向き線形予測
後向き線形予測
レビンソン・ダービンのアルゴリズム
分析フィルタと合成フィルタ
スペクトル包絡の推定
声道断面積関数
LPC係数とPARCOR係数
LPC係数とLSP係数

第8講 音響分析すれば見えてくる
音声の特徴
ゼロ交差率
音声区間検出
自己相関関数
ピッチ抽出
フォルマント抽出

第9講 ボコーダを使えばロボットの声もつくれます
音声の符号化
分析フィルタと合成フィルタ
声帯音源の簡単化
ハイブリッド方式
LPCボコーダ
ミュージシャンのボコーダ

第10講 ボイスチェンジャでカワイイ声をつくるには
声質の役割
早送り再生とスロー再生
スペクトログラムの拡大と縮小
ピッチとフォルマントのコントロール
ヘリウムボイス

第11講 その人の声質で音声合成してみます
コーパスベースの音声合成
音韻論と音声学
日本語音声の統計的性質
音素バランス文
アノテーション
音声素片の連結
AI技術による音声合成

第12講 ニューラルネットワークを使ってみよう
ディープラーニング
ニューラルネットワーク
データセットの作成
モデルの定義
学習
評価
音声分類の可能性

内容説明

ボイスチェンジャのしくみが根本からわかる、音声処理プログラミングのはじめの一歩!博士とマルオ君のやりとりを通して、音の研究の基本が、楽しく学べる!

目次

第1講 周波数特性って、なんですか?
第2講 画像から音って復元できるの?
第3講 重ね合わせれば歌声だってつくれます
第4講 音声って、一体どんな音?
第5講 つくればわかる日本語の音声の特徴
第6講 音声認識がやっていること、ご存じですか?
第7講 音声生成の物理とつながる美しい数学の世界
第8講 音響分析すれば見えてくる音声の特徴
第9講 ボコーダを使えばロボットの声もつくれます
第10講 ボイスチェンジャでカワイイ声をつくるには
第11講 その人の声質で音声合成してみます
第12講 ニューラルネットワークを使ってみよう

著者等紹介

青木直史[アオキナオフミ]
1972年札幌生まれ。2000年、北海道大学大学院工学研究科博士課程修了。博士(工学)。現在、北海道大学大学院情報科学研究院助教。専門はマルチメディア情報処理(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

最近チェックした商品