2代目 干瓢うぉっち

サウンドエンジニア/クリエータ観点の話を中心にダラダラ覚え書きするブログ

インパルスってなんだ?サウンドクリエータから見たインパルス応答(IR)

インパルス信号とは

 電磁気学音響工学などの教科書によく書かれている「インパルス信号」。時間幅が0で高さ無限大のパルス信号のことを言う。

f:id:kanpyo:20210222165601p:plain

▲ 理想的なインパルス信号


 ただ、僕らが扱っているデジタルオーディオは必ず信号をサンプリング周波数に基づいて時間サンプリングしていて、信号の大小を記録しているので、「時間幅0で周波数的な情報を持つ」はありえない。レベルも16bit 24bitのように表現可能なレベル幅に上限がある。

 デジタルオーディオにおけるインパルス信号では、1サンプル目で最小→最大、2サンプル目で最大→最小に遷移する2sampleの信号のことを便宜的に言う。

f:id:kanpyo:20210222165933p:plain

▲ 行って帰ってくるまでがインパルス


 つまり、Fs=48kHzのインパルスと、Fs=96kHzのインパルスでは、後者の方が秒間2倍サンプリングされているので幅が1/2になる。アナログの場合このサンプリングという考えがない(常に連続)ので幅が0に近似する。インパルス信号はサンプリング周波数(fs)に依存する。


インパルスは全帯域に成分を含む信号のこと

 サウンドリエータの観点で言えば、インパルスは「全帯域に成分を含む信号」と覚えておくとよい。このインパル信号は超低域から高域まですべてのサイン波を足し合わせた結果で表現でき、ことデジタル化されたオーディオの世界ではこの帯域というのはサンプリング周波数(Fs)に依存する。つまりFs=48kHzのインパルスと言えばサンプリング定理より24kHzまで、Fs=96kHzのインパルスであれば48kHzまでの成分を一様に含む信号ということになる。

f:id:kanpyo:20210222170206p:plain

▲ インパルスの時間波形とスペクトログラム

TSP信号(SS信号)とインパルス信号

 全帯域に成分を含む信号としては、TSP(Time Stretched Pulse)がある。これはインパルスの時間を伸長したもので、低域から高域まで音程が連続で変化する信号のことを言う。つまりサインスウィープのこと。下から上へスウィープすれば「プィィイ」、逆は「ピュン」というような音になる。

f:id:kanpyo:20210222170408p:plain

▲ スウィープアップによるTSP信号。周波数特性を測るときによく使う。インパルスやホワイトノイズよりも精度が高いが、過渡的なノイズが入りやすいというデメリットがある。


 TSPの利点は音響解析などの分野でS/Nが稼げる(一様な信号レベルに対する時間経過によって、対時間での相関が稼げる)といった測定観点での話が主で、クリエータ観点で言えばあまり関係がない(のでスウィープだと思っておけばいい)。

 どちらも全帯域に成分を含むのは同じだが、決定的に違うのは、かかる時間がインパルスの方が圧倒的に短いということ。TSPの場合は「スウィープする時間」かかるが、インパルスは幅が最小の信号なので、発音中の環境の過渡的な変化を(ほぼ)気にしなくてよい。


インパルス応答(IR)でわかる「環境の特性・性格」

 ある音が発生したときに、その発生した環境によって音の残り方は変わってくる。

 例えば、
・お風呂場では残響時間が短く、高い音から低い音まで残りやすい。
・森の中では、残響時間が長く、高い音と低い音が消えやすい。
・羽毛布団の中では、残響時間がごく短く、高い音が消えやすい。

 など環境によって音に与える特性変化は様々ある。

 インパルス信号には全帯域に成分を含むので、これらの環境下でインパルスを鳴らしてやると、全体域でどのように音が残るか(出てくるか)の性格がわかる。クリエータ観点で見れば「時間」と「レベル」の2点だ。

・時間:音の残響時間
・レベル:どの帯域(高さ)の音が減衰しやすい/残りやすい

f:id:kanpyo:20210222170639p:plain

▲ インパルスとホールのインパルス応答


 これが非常に画期的で、環境の特性を得るのにいちいち環境をシミュレーションしたりする必要がなく、インパルスを入力するだけで、出力として特性がわかる。
 
 ある環境にAという音を入れるとBになって出てくる。あるアンプのキャビネットにAを入れるとBになって出てくる、というように、入力Aに対するBという特性・性格変化が起きる。

 このBがどれだけ変化したか、を示すものがインパルス応答の特性に相当する。空間に限らず、電子回路、機器など、入力に対してパッシブに影響を与え出力されるものであればなんでもよく、特性を得られる対象というのは様々ある。

f:id:kanpyo:20210223153856p:plain

▲ インパルス応答の活用例。図はギターアンプシミュレータ(Ampritube4)

インパルス応答で得た特性を畳み込む(Convolute)

 インパルス応答で得た特性をドライな信号に掛け合わせることによって、疑似的にその特性を再現することができる。この行為を畳み込む(Convolute)という。

 
 たとえば、Convolution Reverbであれば、ある森林で得たインパルス応答(IR)をピアノの音色に畳み込めば、森林でピアノの音色を鳴らしたのと同じ残響感を疑似的に再現できるし、Ampシミュレータでも、あるキャビネットから得たインパルス応答をギターの音色に畳み込むことで、そのキャビネットを通したF特感を再現できる。

インパルス応答のIRデータは、「状況の再現」であることに注意

 では、森林のインパルス応答データがあれば、森林で鳴ってる感をすべて表現できるかというと、そうではない。

 IRは当然、インパルスの発生地点から特定の位置(10m離れた位置とか)で、特定の時間だけ取得したものなので、それを畳み込めばすべてその状況を模した音になるということには注意が必要。

 たとえば、コンサートホールであれば、観客席の前列か後列かによってIRは異なるし、舞台上の演者が左にいるのか、奥にいるのか、という位置によってもIRは変わる。フルオーケストラのマスターにコンサートホールのIR リバーブを畳む、というのはよくやりがちな事例で、それっぽくはなるが、ものによっては不自然に感じる場合もあることに注意したい。