新しい音声処理について

新しい音声処理について

CD などの音楽信号の最適復元

CD などの音楽信号の復元では,可聴帯域を 0 - 20kHz と仮定し, 高域をシャープにカットするという手法が用いられています. これは Whittaker-Shannon のサンプリング定理を用いた処理方法 ですが,次のような問題があります.

    • Shannon の公式は非因果的フィルタなので これをそのまま復元に用いることはできない.

    • CD のサンプリング周波数(44.1kHz) からこの定理によって 導かれる再現可能限界(ナイキスト周波数) 22.05kHz は 可聴帯域を 20kHz としても十分余裕があるとは言えない.

第 2 の問題があるので,通常は 20kHz 以上をディジタルフィルタで シャープにカットします.しかし,これは時間応答で元の波形には なかった波打ち(リンギングという)を発生させ,有害な歪みを 生じてしまいます. CD の音が硬い,冷たい,金属的である という不満は多くはこのリンギングに起因するもののようです.

これらの問題を取り除くには,サンプル点間の間にどのような 情報があったかを補間する理論が必要です. 近年制御理論の分野で画期的な進歩のあったサンプル値 制御理論がそのための最適な土台を提供します.これによって, 従来のディジタル信号処理の理論とは異なって,

    • 連続時間実特性を保証するフィルタが設計できる

ことになります.また旧い録音(例えば Furtwaengler の多くの録音)では, 録音機器の特性などから 周波数特性が歪められている(主として高域のロス)場合が多いのですが, その特性(アナログ周波数特性)をフィルタ設計ルーチンに入れ込むことによって, このような特性を最適に修正・復元することができます. 実際に,既存の CD (1950年代の録音)をこれによって最適補正し, 瑞々しい音によみがえらせることに成功しています. (サンプルをここに載せることが出来ないのが残念ですが New! 下記参照.)また 新しい録音でも CD 特有のリンギング歪みが除かれたクリアーな 音質を楽しむことができます.

New: YY フィルタのハードウェア実装

現在このような原理に基づいて設計したフィルタを YY フィルタと 呼んで,研究および開発を進めていますが,このたび CD の帯域を 8 倍オーバーサンプリング処理し,DSP に YY フィルタを組み込んだ DA コンバータの実験機 が完成しました.現在当研究室の 実験室 でデモしていますので,どなたでも試聴していただけます.

音質は CD 特有の高音域の金属的な攻撃性や,詰まった感じがなくなり, ライブのように高音の伸びきったリアルかつ自然な音質が楽しめます. 特にボーカルや大編成のオーケストラではそのリアルさに圧倒されます.

New: YY フィルタによる圧縮音源からの最適復元

この YY フィルタを用いると,可聴帯域内でも帯域圧縮したものを かなりもとのものに近く再現することが可能になります.下でも解説 していますが,これを用いて,サンヨー株式会社と共同開発したものが 7 月 29 日付の日本経済新聞に載りました. 一部 を載せておきます.

さらに本YYフィルタの技術は、三洋半導体が開発・製造・販売する複数 のLSIにおいて採用されており、MDプレーヤ,MP3プレーヤ,CDプレーヤ,ボイスレコーダ, 音楽ケータイの主要メーカのセットに搭載され好評を博しています.LSIの出荷累計は5年間で 2000万個に達しており,民生用の音声・音響機器の高性能化に貢献しています.

音サンプル

ファイル(2)の実効帯域は11kHzであるのに対し,(3)のファイルはそれを YYフィルタ処理によって帯域を2倍に拡大している.元のソースがそう広帯域 ではない(MP3のため16kHzに限られている)でないため,それほど画期的な 帯域拡大は望めないが,それでも18kHz程度までのレンジが確保されている. (2)ではヴァイオリンセクションの音が若干荒れてかつ詰まった感じがするのに 対し,(3)では上の方まで伸びやかに再生されている. [三洋のチップでは,16kHz-20kHzの部分にYYフィルタを用いて帯域拡大を しており,一層高いクォリティを得ている.]

YY フィルタによるノイズ除去

YY フィルタを応用してノイズの除去を行うことができます.現在 京都ディジタルアーカイブ研究センターに協力して(平成15年10月1日付 京都新聞) SP レコードからの音源のノイズ除去と音質改善を 行っています.従来ノイズを除去すると,それと同時に音質劣化 (高域の欠落)が起るのが通例でしたが,ここではそれをほとんど 感じさせない処理を可能としています.これは YY フィルタの 高域補間能力によるものです.詳しくは下記リンクをご参照下さい.

YY フィルタを応用した音声圧縮

これはあるソースを新しい処理方式で 圧縮したものをふたたび Wave ファイルに落としたものです. CD の形式では片チャンネル 1 秒あたり 705k ビット必要ですが, ここではそれを約 11 分の 1 の 1 秒当り 64k ビットまで圧縮して います.場合によってはさらに圧縮して 20 倍以上の圧縮も 可能です.(ここではそれを再び Wave ファイル にしてコンピュータで再生可能にしているので, 表面上は 705kbps になっています.)

関連する文献,解説など