日本大学文理学部情報学科
北原研究室 福田康太
本研究では,音楽知識が乏しい人でも容易に副旋律を練習できる支援システムの開発を目指し,音響信号を対象とした副旋律生成手法を検討する.従来の副旋律生成手法の多くはMIDIデータや楽譜データを基にしたものであり,実際の音響信号を直接処理するものは限られていた.本研究では,音響信号から直接副旋律を生成するアプローチを提案し,主旋律と調和する副旋律の音高を決定するために隠れマルコフモデル(HMM)を活用する.
提案手法では,まず音源分離技術を用いて主旋律と伴奏を分離し,伴奏のクロマグラムを抽出する.その後,HMMを用いて副旋律の音高を推定し,音楽的な調和を考慮した音高遷移を実現する.さらに,ロングトーン部分の安定性を向上させるための遷移確率の調整や,伴奏との不協和音を避けるための出力確率の最適化を導入した.
評価実験では,Jポップ・演歌・ボーカロイドの3つのジャンルから計12曲を選定し,提案手法と従来手法の比較を行った.その結果,すべての楽曲において提案手法が最も高い正解率を示し,副旋律生成の精度向上が確認された.一方で,ボーカロイド楽曲において正解率が低い傾向が見られた.これは音源分離の精度の影響により,伴奏側に主旋律成分が混入することが原因と考えられる.また,演歌の一部楽曲では,演歌独特の歌唱法が多用されているため,楽譜データを基にした正解データとの比較が困難になり,正解率の低下につながった可能性が示唆された.
本研究の成果により,音響信号を基にした副旋律生成手法が一定の条件下で有望であることが示唆された.今後の課題として,転調への対応を含めた副旋律生成手法のさらなる改善,音源分離技術の向上による精度向上,そしてユーザが実際に練習しやすいインターフェースの開発が挙げられる.これらの課題に取り組むことで,より多くのユーザが手軽に副旋律の練習を行える環境の構築を目指す.