旋律の歌唱可能性の
定量化に向けた
歌唱の正確さの一分析
旋律の歌唱可能性の
定量化に向けた
歌唱の正確さの一分析
日本大学 文理学部 情報科学科 北原研究室
川原未波
概要
本研究は, AI技術を用いた歌唱旋律の生成における「歌いやすい」を定量化することを目的としている. 特に, 歌唱者が音程を正確に歌える旋律を自動生成するために, 音程やリズム, 歌詞の要素がどのように歌唱精度に影響を与えるかを解析する. 本研究ではその前段階として, 実際に実験参加者に歌唱してもらい, その歌唱がどれくらい正確に歌えているかを分析する. 実験では, 音の跳躍, BPM(Beats Per Minute), 歌詞の組み合わせによる18種類の旋律を用い, 100名の参加者に歌唱実験を行った. 録音されたデータはpYINアルゴリズムで解析し, 録音データと正解データのcent値の中央絶対誤差(MedAE)を使って音高の一致率を評価した.
結果として, 音の跳躍パターンがMedAEに大きな影響を与える一方で, BPMの変化による影響は比較的小さいことが分かった. 具体的には, 音の跳躍が大きい(例えば3度以上)の場合, 歌唱者が音程を維持するのが難しく, MedAEが高くなる傾向が見られた. 一方, BPMの変化については, 一定範囲内ではリズムに適応しやすく, 歌唱精度への影響は限定的であった. この結果は, BPMが歌唱精度に与える影響がそれほど強くないことを示している. また, 参加者の慣れが精度に影響する可能性も示唆された. 特に初めて歌唱した旋律では, 音程が安定せずMedAEが高くなる傾向が見られたが, 歌唱を繰り返すことで精度が向上した. 今後の研究では, 特に影響が大きい音の跳躍パターンに注目し, 歌詞やリズムが歌唱精度に与える影響も含めたさらなる分析が必要である.