ジャズやポップスにおける即興演奏は,演奏技術のみならず,フレーズを即座に構想する高度な認知・運動スキルを要求される.そのため,初心者にとっては習得の障壁が高く,あらかじめ指に馴染んだフレーズ(手グセ)や,単純なスケールの上下動に依存しやすく,創造的なアドリブへと発展しにくいという課題がある.本研究の目的は,こうした初心者の「次に何を弾けばよいかわからない」という行き詰まりを解消するため,ユーザー自身の演奏を起点とし,その特徴を保持しながら適切な難易度に調整された類似フレーズを提示する「演奏入力対応型メロディ生成システム」を構築することである.
提案システムは,CVAEを基盤とした生成モデルを採用している.学習データとしてジャズの単音メロディを用い,4小節単位のユニットごとに,音符の出現密度を規定する「最頻音価」および調性を規定する「ピッチクラス分布」からなる13次元の条件ラベルを付与して学習を行う.推論時には,潜在空間上でのベクトル補間やリズムテンプレートを用いた確率分布の操作を導入することで,入力演奏の特徴を維持しつつ,音符密度の制御を可能とした.
評価実験では,客観的指標および主観的指標を用いて生成メロディの品質を検証した.音楽理論的指標による評価の結果,生成されたメロディのコードトーン一致率(CTAR)は多くの条件で60〜80%台に達し,人手による演奏と同等の和声的安定性を示した.また,入力演奏に対する類似度評価において,リズム構造の類似を示すOnset F1 Scoreは0.6〜0.8,旋律概形の類似度を示すContour Cosine Similarityは0.74 〜0.94という高い値を得ており,ユーザーの演奏特徴を良好に保持できていることを確認した.さらに,作曲・即興演奏経験者30名を対象としたブラインドテスト形式の聴取実験において,いくつかの生成フレーズは人間の演奏のように自然であり,伴奏と調和しているとの評価を得た.
以上より,本システムはユーザーの演奏に基づいた多様な演奏例を提示可能であり,即興演奏学習における有効な支援基盤となり得ると考える.
本研究で学習したモデルを用いたメロディの生成を体験できるWebサイトです.