音波の解析 -猫のモノマネ-

こんにちは、20-yoです
いつもはアクア研の紹介しかしていませんが、たまには毛色の異なるものを

今回の対象:音波

演劇をやったことはありますか?

演劇を英語と日本語両方でやったことがある身としては、演劇には言語的に適性があるように感じてなりません
今回は、演劇の発声の練習方法:猫の声真似、に関しての音の分析の一覧を掲示します(猫の声真似入っている発生練習

クリスマス・イブ目の前にして、カラオケオールするなんて人もいるのかな
声出しに猫の声真似をしてみてはいかがでしょう

この記事はrogy Advent Calender 2022の12/23の記事です

まずは、普通に音波を表示(ちなみに解析含め、すべてmatlab使ってます。pythonでもできるはず)

なにをどう特徴づけたらいいのやら・・・

音ってそもそも、3要素あるっていわれてます
ラウドネス(音量)、ピッチ(音高)、音色。(てか、音色は、ラウドネスとピッチ以外の音の特徴を指す、っていう衝撃の事実をついこの前、大学の講義で学びました。すべての声の特徴をこれらで包含できるねwってさ)
じゃあ、とりまこれらを表せる指標を作成していきますか、ということで

音量

次にピッチを表示したいけど、声って、そもそもピッチが時間ごとに変化するよねってなる
このピッチの変化を時間変化ですべて表示したくね、って思ってたら、フーリエ変換の授業で出てきました、スペクトログラム

これは要するに、ある一定時間に区切って(窓関数を掛け算してあげて)、そこの範囲内でフーリエ変換してピッチを計算し、その時間区間をずらしてそこでフーリエ変換して、っていうのを繰り返して、その結果をプロットしただけのもの
よくこのスペクトログラムを見てみると、ある周波数周辺が高まっている場所が何か所かある
これをフォルマントと呼ぶらしい

最後にピッチをプロット

ちょっと、ピッチがおかしそうです。修正が必要そう。青がピッチ、赤が第2フォルマントのはず。

でも、今回は声の出している場所を気にしているから、声道をモデル化したものを基に、スペクトル包絡を描くと、

他にも、特徴量を抽出する方法として、NMFってのが用いられれるらしい
今回は、音だからdB値がマイナスになっちゃうので、スペクトログラムの色をベースにNMF

あとは、声帯の振動も気にしたいので、ゼロクロス数も求めてみた

今回は教養卒論のためにやってみていることを書いているので、あんまり詳しくはかけませんでしたが(自己剽窃ってのがあるらしいから、一番用いなさそうな音声をひっぱってきました)、これが、水中の音波解析や、その他のことにも役立ったらいいなと思いつつ
しかも、水中の音波解析とかだと、動物を相手にしない限り、物理量と心理量の区別(基本周波数とピッチの違いとか)を気にしなくてよさそうだから比較的考えることが少ない気も

ここには間違いもあるかもしれないので、この記事は、キーワードとしての把握程度にしていただき、
ぜひ、音響信号学の本とか読んで正確なのを学習してみたり、MATLABのwebページにある詳しい信号処理の仕方を見てみたりしてみてください!
参考図書:
平坂文男『実験音声学のための音声分析』関東学院大学出版

ここまでお読みいただきありがとうございました!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です