【スピーカアレイ駆動システム】フレームの寸法

オーディオ信号のリアルタイム処理では，信号はある一定の長さのフレーム（frame）毎に処理されます。フレームの長さは，システムの性能に直接影響します。例えば，出力される信号は，入力される信号に対しフレームの長さだけ遅れて出力されます。また，フレームの長さだけデータを格納しておくためにメモリが必要になります。一方，高度な処理をする場合は，フレームの長さは長くなる傾向があるでしょう。

さらに，スピーカアレイ駆動システムでは，通常のオーディオ信号の処理に加えて注意すべきことがあります。このシステムでは，集束または拡散する音響波面を発生させるため，生成する複数の信号の間に相対的な遅延時間を与えます。このため，最終的な駆動信号を生成するために複数のフレームに渡る処理が必要となってきます。この稿では，スピーカアレイ駆動システムのフレーム長について考察します。

処理の流れ

現在，二次元ΔΣ変調を用いるスピーカ駆動システムの駆動信号生成には大きく分けて２つの手法が存在します。遅延処理の後で二次元ΔΣ変調をするか，二次元ΔΣ変調後の信号に遅延処理をするか，の２つです。

遅延処理後に二次元ΔΣ変調
オーディオ信号に遅延を与えて，集束または拡散する波面を発生させる信号を作ります。次に，このオリジナルの信号を二次元ΔΣ変調して時間と空間の両次元に関して密な1ビットの駆動信号としています。
この構成は，オリジナルの信号を高いSN比で再現することができるというメリットがあります。一方，オリジナルの信号が高い周波数成分（空間または時間あるいは両方の次元）を持つ場合，二次元ΔΣ変調が不安定になることがあります。不安定になるとオリジナルとは全く異なる信号が生成されるてしまいます。このため，再現できる音場が制限されます。例えば，集束音場を作る際に焦点の方向の角度を大きくできなくなります。これがデメリットです。
二次元ΔΣ変調に遅延処理
遅延を与えない信号を二次元ΔΣ変調で変換した後で，この1ビット信号に相対的な遅延を与えて駆動信号にします。これは，安定に動作する条件下でのオリジナル信号を二次元ΔΣ変調してから，焦点形成のための遅延を与えることになります。
この方法のメリットは，どのような遅延を与えても，二次元ΔΣ変調の動作には影響がないことです。このため，集束波面の発生の場合，視野角を広く設定することができます。一方，デメリットは，再現される波面のSN比が遅延処理後二次元ΔΣ変調より低下することです。

遅延処理

遅延処理について，直線上にスピーカを配置したアレイを使い，1点に集束する音場を発生する例について説明します。

収束音場を発生させるための遅延

図のような，直線上にスピーカを配置したアレイを考えます。このアレイを含む，ある平面内の音場のみを扱うことにします。

平面内の１つの点を，そこに音場が集束する点（焦点）として設定します。

以下では数式を使って説明します。スピーカが配置されている直線を $x$ 軸に，アレイの中心を通り対象となる平面内に $z$ 軸をとります。 $i$ 番目のスピーカの $x$ 座標を ${x_i}$ ，焦点の位置座標を ${(x_i,z)}$ とします。

①まず，はじめに，全てのスピーカを同じ信号 $\displaystyle u(t)$ で駆動する場合を考えましょう。なお，説明を簡単にするため，波形 $u(t)$ は，非常に短い正弦波パルスで表しています。また，波形の時間原点， $t = 0$ は，駆動信号の送信を始める時刻であるとします。つまり， $t<0$ では信号は

② $i$ 番目のスピーカから送信され，焦点として設定した点に到達する音響波 ${r_i(t)}$ は，

${r_i}(t) = u(t - {\tau _i})$

と近似して書くことができます。ここで， ${\tau _i}$ は， $i$ 番目のスピーカと焦点の間の音響伝搬時間で，スピーカの座標を ${(x_i,0)}$ ，音響波の伝搬速度を $c$ とすると，

${\tau _i} = \frac{{\sqrt {{{(x - {x_i})}^2} + {z^2}} }}{c}$

となります。

受信される信号は伝搬距離に応じて減衰するので，スピーカの位置により異なります。しかし，この減衰の値はほぼ一定と考えて，数式中では略しています。（詳しいことは，別稿で説明する予定です。）

設定した点で観測される受信波は，各スピーカから到達する波形の総和になります。図の②に示したような状況では，スピーカのすべてを同じ信号で駆動すると，各スピーカから到達する信号波形は，遅延時間が互いに異なっています。このため，波形が打ち消しあって，観測される受信波の振幅は小さなものになります。

③そこで，伝搬時間を補償して送信することを考えます。 $u(t)$ に対して伝搬遅延時間の符号を逆にした遅延を与えた信号を，駆動信号とします。この信号で駆動されると，各スピーカから放射され設定点に到達する音響波は，全て同じ時刻に到達します。この結果，設定された点に音響波が集束することになります。

${u_i}(t) = u(t) + {\tau _i}) (i = 1,2, ...,N)$

この駆動信号は ${u_i}(t)$ は，図③の赤色で表されています。これからわかるように時刻 $t<0$ で値を持つので，実際には作ることができません。（時刻 $t=0$ より前の過去に戻ることはできないので。）

④そこで，全ての駆動信号を遅延時間 ${\tau_i} (i = 1,2,...N)$ の最大値 ${\tau_{max}}$ だけ遅延したものを駆動信号とします。

${u_i(t)} = u(t+{\tau_i}- {\tau_{max})$

これらの信号の遅れ時間は0～ ${\tau_{max}$ の範囲になります。ですから図④に示すように，信号の値が定義されているのは $t>0$ となることがわかります。

遅延の実装

信号の遅延をソフトウェアやハードウェアで実現する方法について解説します。

遅延線（Delay Line）
ハードウェアで実装する場合は，シフトレジスタやメモリを使った遅延線として実装すると考えやすいことがある。
配列のポインタ
配列に信号データを書き込んでおき，それを読み出すことで遅延を実現できる。MATLABやC/C++言語を使って設計する場合は，配列の添え字（インデックス）やポインタを操作することで，遅延された信号を生成する。

現在のシステム構成では，信号を発生する部分はMATLABを使っています。そこで，これ以降では，配列を用いる方法について説明していきます。

条件は以下のとおりです。

二次元ΔΣ変調後遅延を想定
フレームのデータは二値に変換され時間的にオーバーサンプルされている。本研究ではサンプリング周波数は3MHzとしている。なお遅延に関しては，データが二値化されていないことを除き，二次元ΔΣ変調後遅延方式と遅延後二次元ΔΣ変調方式とでは同じ処理になる。
フレーム長は最大遅延 ${\tau_{max}}$ より長いものとする
出力信号のフレームも同じ長さとする
この遅延処理は，二次元ΔΣ変調で得られたデータを入力とし，出力される信号（駆動信号）は入力と同じ長さのフレーム単位で出力されるものとする。

出力フレームは，入力フレームの配列から，集束のための遅延 ${\tau_i}$ に応じて計算されたインデックスでサンプルした値を並べたものになっています。図の①は，出力フレームの最初のデータを作る処理を表しています。入力フレームは2次元配列の形になっています。赤色の点線は入力フレームの最初のインデックス（左端を指しています）から ${\tau_i}$ だけ遅らせたものを表しています（以下，“サンプルライン”と呼ぶことにします）。赤い線の上の黒丸が，値をサンプルする位置を示しています。