多次元フィルタバンク

多次元フィルタバンク

フィルタバンクとは、信号処理の基礎技術であり周波数帯域ごとに信号の成分分析を行う技術である。標準的には、互いに重複しない通過域を有するフィルタの集合体であり、通過域の和により全帯域を網羅し、また変換し逆変換をした場合に元の信号が完全に復元できる特性を有するものである。しかし、広義には周波数解析ができるフィルタの集合体でしかない。

フィルタバンクは、様々な分野に応用されており特に画像や動画像の圧縮が一般には有名である。例として、JPEGやMPEGなどで用いられている離散コサイン変換(DCT)やJPEG 2kなどで用いられている離散ウェーブレット変換(DWT)が挙げられる。それら変換符号化は、一般的な自然画像・動画像は滑らかに変化しておりエネルギーの多くが低周波数帯に集中している性質を利用し、フィルタバンクにより変換すると信号のエントロピーが低下するのでエントロピー符号化により効率的に圧縮できるというものである。

本研究室では、画像などの二次元信号や動画像などの三次元信号を対象としたフィルタバンクに関して研究しており、また更に高次元の信号を対象にしたフィルタバンクを研究している。多次元フィルタバンクとは、上記フィルタバンクの概念に加えて次元数に関して一般化したものである。一般的に、低次元フィルタバンクの組み合わせで高次元フィルタバンクは実現可能であるが、実現できる周波数特性に制限があり、より効率的な解析には信号と同次元のフィルタバンクが有効である。

図1に、多次元フィルタバンクの利点に関する例を示す。図1(中央)は、(左)を一次元フィルタバンクの組み合わせにより変換しノイズを加えて逆変換を行った結果画像である。また(右)は、同様の処理を二次元フィルタバンクを用いて行った結果画像である。赤枠内を見てわかる通り、斜めのストライプという二次元的な信号情報を二次元フィルタバンクは効率的に分割できているため、ノイズによる劣化はあるもののストライプおよびその方向情報が保持できている。

図1 (左) 原画像、(中央) 一次元フィルタバンクでの結果画像、(右) 二次元フィルタバンクでの結果画像