山本 雄也 (Yuya Yamamoto) Ph.D. (Informatics)
AlphaTheta株式会社
yuya.yamamoto [at] alphatheta.com
個人アドレス: yyamamoto13044aa [at] gmail.com
in English here.
Github: yamathcy
LinkedIn: https://www.linkedin.com/in/yuya-yamamoto-263602151/
2013年4月 中央大学理工学部精密機械工学科 入学
2017年3月 中央大学理工学部精密機械工学科 中途退学
2017年4月 筑波大学情報学群情報メディア創成学類 3年次編入学
2019年3月 筑波大学情報学群情報メディア創成学類 卒業
(人と音の情報学研究室,学士(情報メディア科学))
2019年4月 筑波大学大学院図書館情報メディア研究科 博士前期課程 入学
2021年3月 筑波大学大学院図書館情報メディア研究科 博士前期課程 修了
(人と音の情報学研究室,修士(情報学))
2021年4月 筑波大学大学院人間総合科学学術院人間総合科学研究群情報学学位プログラム 博士後期課程入学
2024年3月 筑波大学大学院人間総合科学学術院人間総合科学研究群情報学学位プログラム 博士後期課程修了
(人と音の情報学研究室,博士(情報学))
2024年4月より現職
2016年2月-3月 荏原税務署 確定申告入力補助スタッフ
2017年10月-2021年10月 CA Techkids 株式会社 学生アルバイト (小中学生へのプログラミング指導,Unityコース教材作成業務)
2019年8月-9月 産業技術総合研究所 メディアインタラクション研究グループ 技術実習生
2021年12月 筑波大学 ティーチングフェロー(TA業務およびゲスト講師として1回分を講義)
2022年8月-12月 韓国科学技術院 (KAIST) Visiting Student Researcher
2024年2月-3月 日本大学 リサーチアシスタント
AlphaTheta
拍節の規則性を考慮したビートトラッキング
音楽音響信号を入力に拍(ビート)と小節線(ダウンビート)の位置を推定する問題であるビートトラッキングは、他のタスク同様深層学習によって従来手法よりも正確に楽曲のリズムを捉えるようになりましたが、完璧ではありません。明示的に拍や小節の法則性を上手く組み込むことによって、アプリケーションレベルの使用に耐え得るビートトラッキング手法の開発を目指しています。
A DBN-Based Regularization Approach for Training Postprocessing-free Joint Beat and Downbeat Estimator,
Yiming Wu, Yuya Yamamoto, Shunya Ishikawa, ISMIR LBD 2024
学生時代
自己教師あり学習モデルの歌声識別タスクへの応用について
ラベル付きデータを多数用意することが難しい歌声識別タスク(歌手識別,歌声採譜等)に対し,音声や音楽の自己教師あり学習済みモデルが適用可能かどうか,適用するとしたらどのようにすればいいかの探索を行いました.
Toward Leveraging Pre-Trained Self-Supervised Frontends for Singing Voice Understanding: Case Studies on Three Tasks,
Yuya Yamamoto. APSIPA ASC 2023.
歌唱テクニック検出
既存曲からどんな歌唱テクニックがいつ現れているかを検出するためにデータセットCOSIANを構築し,またベースラインとして歌声特有の特徴を考慮したDNNモデルを考案しました."伴奏つき音楽から"、"複数の歌唱表現を"、"時刻情報で検出"できた、世界初の事例です。
PrimaDNN’: A Characteristics-aware DNN customization for singing technique detection,
Yuya Yamamoto, Juhan Nam, Hiroko Terasawa, EUSIPCO 2023. [webpage]
Analysis and Detection of Singing Techniques in Repertoires of J-POP Solo Singers,
Yuya Yamamoto, Juhan Nam, Hiroko Terasawa, ISMIR 2022. [webpage]
歌唱テクニック識別
歌唱中に用いられている歌唱テクニックの識別における音響特徴抽出および識別器を学習する方法を探求しました.様々な歌唱表現の性質を拾えるように複数解像度スペクトログラムや変形可能畳み込みニューラルネットワークを用いるなどして特徴抽出を工夫しました。
Deformable CNN and Imbalance Aware Feature Learning for Singing Technique Classification,
Yuya Yamamoto, Juhan Nam, Hiroko Terasawa, Interspeech 2022.
Investigating Time-Frequency Representations for Audio Feature Extraction in Singing Technique Classification,
Yuya Yamamoto, Juhan Nam, Hiroko Terasawa, Yuzuru Hiraga, APSIPA ASC 2021.
その他,人間の嗜好をフィードバック可能なHuman-in-the-loopコード進行自動生成,印象語による制御可能シンセサイザー,加齢性難聴者の音楽認知、J-POP楽曲の歌唱難易度に関する心理統計分析等の研究を行っていました.
2019年8月 情報処理学会音楽情報科学研究会 第124回研究発表会 学生奨励賞
2021年3月 筑波大学大学院 図書館情報メディア研究科長表彰
2021年9月 情報処理学会音楽情報科学研究会 第132回研究発表会 ベストプレゼンテーション賞(Best Research 部門)
2023年3月 2022年度 情報処理学会 山下記念研究賞
2023年6月 音学シンポジウム2023 学生優秀発表賞(共著)
2023年10月 情報処理学会論文誌 特選論文 選定
2024年 3月 筑波大学大学院 人間総合科学学術院長表彰
2021年 7月 台東区立駒形中学校 キャリア講演
2023年1月 ISMIR 2022読み会 主催
2024年1月 筑波技術大学 招待講演
IEEE TASLP 2023, 2024, 2025
EURASIP Journal on Audio, Speech, and Music Processing 2024
IEEE ICASSP 2025
IJCNN 2025