GTTM分析器「PyGTTM」の試作,及び,
ディープラーニングを用いた精度向上の試み
ディープラーニングを用いた精度向上の試み
日本大学 文理学部 情報科学科 北原研究室
山川 峻
概要
人間が楽曲のジャンルや年代の推定を行うとき,使われている楽器などからだけでなく,楽曲内の構造を無意識に感じとり,行っているのではないかという仮説から,楽曲中には構造的に何らかの特徴があり,それを抽出することができれば,より精緻な楽曲分析が行えるだろう.楽曲から構造を取り出す手法として,GTTM が挙げられる.音楽の認知過程から階層的な構造の分析を目的とした理論である.
本研究は,音楽を階層的な構造で表すことができる GTTM を利用して,楽曲の構造を自動で取り出すシステムの開発を目指している.既に浜中らによって自動 GTTM 分析器の ATTA が公開されているが,コードを確認しながらの構造分析ができないといったことから,ATTA に基づいた GTTM 分析器「PyGTTM」の試 作を行った.
ATTA との比較実験では,GTTM データベースに収められてる楽曲データを用いて,グルーピング構造,拍節構造,タイムスパン木の三つの出力結果の比較を 行った.グルーピング構造分析では ATTA よりも高い精度を示したが,拍節構造分析とタイムスパン分析では低い値となった.これは,PyGTTM と ATTA で GTTM の曖昧な部分をどう解釈したかによる,処理のコーディングの違いが原因だと考えられる.しかしながら,ATTA と結果に差異はあったが,ある程度の精度で階層構造を獲得できることを確認した.また,PyGTTM のタイムスパン木には精度に問題があったため,deepGTTM を参考にして,ディープラーニングを用いて精度の向上させる機能の拡張の検討を行っている.