日本大学文理学部情報科学科
北原研究室 名越崇晃
概要
本研究では, 拍節関係を考慮した旋律生成モデルMORTM (Metric-Oriented Rhythmic Transformer for Melodic Generation) を提案し, リズム制約を導入したシーケンス表現と新たな損失関数を設計することを目的とする. 従来のMIDIシーケンスを用いた音楽生成モデルでは, テンポの違いによりシーケンスの冗長性が生じ, リズムの一貫性が損なわれる課題があった. 特に, テンポが異なる場合に同じリズムパターンが異なるシーケンスとして扱われる問題が発生し, 学習データの増加につながることが指摘されていた.
本研究では, 発音時刻を相対的なティック単位で表現するトークナイザーを開発し, 異なるテンポ環境でも一貫したリズムを保持できるように設計した. これにより, データの冗長性を低減し, より効率的な学習が可能となる. また, リズム制約を導入した新たな損失関数を提案し, 生成旋律が規定された拍節構造に収まることを保証することで, より自然な旋律の生成を実現する.
MORTMの有効性を検証するため, 音高予測実験および旋律生成実験を実施した. 音高予測実験では, モデルがスケール内の音符をどの程度正確に生成できるかを分析し, 旋律生成実験では, 拍節の保持率やリズムの一貫性を測定した. 特に, 旋律生成実験では, 拍節が崩れることなく一貫性のあるリズムパターンが維持されているかを詳細に評価した. その結果, MORTMはリズム制約のないモデルと比較して, 拍節保持率が40\%から80\%へ向上し, スケール外音符の発生率が低減することが確認された. さらに, 拍節構造を明示的にトークン化することで, モデルが長期的な文脈依存を学習しやすくなり, 音楽的一貫性が向上することを示した. 特に, 従来のTransformerモデルでは課題とされていた長期的なフレーズ構造の維持が改善され, より音楽的な流れを再現できる可能性が示唆された. また, リズム制約を適用した場合, リズムが破綻する割合が大幅に減少し, より自然な旋律が生成されることが明らかになった.
本研究の成果は, リズム情報を考慮した音楽生成の有効性を示した。今後の発展として, 異なるジャンルや楽器編成に適応可能なモデルへと発展させ, リアルタイムでの演奏支援やインタラクティブな作曲システムへの応用を目指す. さらに, 生成された旋律の評価指標を拡張し, 音楽的な創造性やスタイル適応性についても検討することで, より高品質な音楽生成モデルの構築を進める予定である.
卒業論文
発表スライド