岩本祐輝
作曲自体には興味があるが,作曲の方法や定石を勉強する時間を確保するのが難しく,作曲に手を出すのを躊躇する人が少なからず存在すると思われる.そのため,専門知識がなくても計算機が作曲してくれるシステムの開発が行われているが,ユーザの嗜好を十分に反映できるものになっているとは限らない.そこで,本研究では,ユーザの嗜好を学習して,ユーザが気に入りやすい曲を自動で作成する作曲ツールの実現を目指す.
本研究では「ループシーケンサー」という数小節程度の短いフレーズを記録したオーディオ素材を組み合わせて1つの曲を作れるようにした音楽制作用ソフトウェア内の音素材を利用している.
ループシーケンサーには様々な音素材が用意されているが,全てのユーザが全ての音素材を満遍なく選択するという訳ではない.ユーザが作曲を進めていくと徐々に選択される頻度の高い音素材と低い音素材のグループが出来ると考えられる.そして,グループ内の音素材は似たような傾向の音素材が集まっていると考えられる.ループシーケンサーにユーザの選びやすい音素材とそうでない音素材の傾向を学習させることで,自動作曲をする際の選択される音素材に偏りを生じさせて,ユーザの気に入りやすい曲が作られやすくなると考えられる.
音素材の傾向を調べるために「librosa」というオーディオファイルの分析等を行うためのPython言語のパッケージを用いて,メルスペクトログラムという特徴量を用いてクラスタリングを行い,各音素材の1つの1つの特徴量のクラスタ番号を数え上げたデータを作る.
そのデータに対して「トピックモデル」という手法を用いる.トピックモデルは文書中に出現している単語の種類と出現頻度に基づいて,その文書のトピック(話題)を類推する手法である.トピックモデルには幾つか種類が存在し,今回はLDAという手法を用いてデータを分析をして,似たような傾向の音素材を分類する.後はユーザが作曲ツール内で手動で音素材を配置した時に選択された音素材の傾向を学習させることで,ユーザの選択頻度の高い音素材や低い音素材の傾向を考慮して自動作曲を行うことが出来るようになる.
本研究の実験では,実験用に簡略化したプログラムを協力達に使っていただいた.実験は2回に分けられ,実験毎に用いる盛り上がり度曲線を変えて,こちらが指定した手順で[Sequence][Drums]部分の音素材を入れ替えていただき,実験が終わる度に質問に回答してもらった.同時に音素材の挿入回数や自動作曲で生成された曲に対する評価等のデータも収集した.1回目の実験にはA,B,C,D,E,F,Gの匿名の7人に協力していただいたところ,比較的音素材の挿入回数が少なく,似たような評価を出したC,Gと,その2人とは対称的に音素材の挿入回数が多く,評価が下がる傾向にあったDの3人が特徴的な結果を出した.C,D,Gの音素材の選び方の傾向を見比べてみたが,似たような評価出したC,Gには一貫した共通点は無く,対称的な結果になっているCとD,GとDで似たような傾向を示している部分が出てくるという結果になった.2回目の実験には1回目の実験に協力していただいたA,Bの匿名の2人に引き続き協力していただいた.1回目の実験と2回目の実験を通してA,Bの質問の回答を見比べてみた結果,盛り上がり度曲線を変えても本研究の提案手法を一定の効果を発揮すると推測することが出来るという結果になった.
準備中...