Kentaro Seki, Nobutaka Ito, Kazuki Yamauchi, Yuki Okamoto, Kouei Yamaoka, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari, “Language-queried target speech extraction using para-linguistic and non-linguistic prompts,” Acoustical Science and Technology, 2025. (Accepted)
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori, Yoichi Yamashita, "Onoma-to-wave: Environmental Sound Synthesis from onomatopoeic words," APSIPA Transactions on Signal and Information Processing, Vol. 11, No. 1, e13, 2022. (2025 Sadaoki Furui Prize Paper Award (Research paper award category),立命館大学 2022年度 情報理工学研究科 研究奨励賞)
砺波 紀之,井本 桂右,岡本 悠希,福森 隆寛,山下 洋一,"誤検出の深刻さを考慮した音響イベント検出のための評価指標," 日本音響学会誌,Vol. 78,No. 5,pp. 217-226,2022.
岡本 悠希,井本 桂右,"統計的手法による環境音・効果音合成," 日本音響学会誌,Vol. 80,No. 12 ,pp. 658-666,2024.
New! Minoru Kishi, Ryosuke Sakai, Shinnosuke Takamichi, Yusuke Kanamori, and Yuki Okamoto, "AudioBERTScore: Objective evaluation of environmental sound synthesis based on similarity of audio embedding sequences," Proc. AAAI Workshop, Audio-Centric AI: Towards Real-World Multimodal Reasoning and Application Use Cases (Audio-AAAI), 2026.
New! Yusuke Kanamori, Yuki Okamoto, Shinnosuke Takamichi, Yuki Saito, and Hiroshi Saruwatari, "Analysis of a dataset for evaluating semantic relevance between text and audio," Sixth Joint Meeting Acoustical Society of America (ASA) and Acoustical Society of Japan (ASJ), no paper (abstract reviewed), 2025. (Accepted)
Taisei Takano, Yuki Okamoto, Yusuke Kanamori, Yuki Saito, Ryotaro Nagase, and Hiroshi Saruwatari, "Human-CLAP: Human-perception-based contrastive language-audio pretraining," Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2025. (Accepted)
Yusuke Kanamori, Yuki Okamoto, Taisei Takano, Shinnosuke Takamichi, Yuki Saito, and Hiroshi Saruwatari, "RELATE: Subjective Evaluation Dataset for Automatic Evaluation of Relevance Between Text and Audio," Proc. INTERSPEECH, pp. 3155-3159, 2025.
Junwon Lee, Modan Tailleur, Mathieu Lagrange, Keunwoo Choi, Laurie Heller, Brian McFee, Keisuke Imoto, and Yuki Okamoto, "Challenge on Sound Scene Synthesis: Evaluating Text-to-Audio Generation," Audio Imagination: NeurIPS 2024 Workshop AI-Driven Speech, Music, and Sound Generation, 2024.
Modan Tailleur, Junwon Lee, Mathieu Lagrange, Keunwoo Choi, Laurie Heller, Keisuke Imoto, and Yuki Okamoto, "Correlation of Frechet Audio Distance With Human Perception of Environmental Audio Is Embedding Dependant," Proc. European Signal Processing Conference (EUSIPCO), pp. 56-60, 2024.
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryotaro Nagase, Takahiro Fukumori, and Yoichi Yamashita, "Environmental Sound Synthesis from Vocal Imitations and Sound Event Labels," Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 411-415, 2024. (立命館大学 2023年度 情報理工学研究科 優秀研究賞)
Keunwoo Choi, Jaekwon Im, Laurie Heller, Brian McFee, Keisuke Imoto, Yuki Okamoto, Mathieu Lagrange, and Shinosuke Takamichi, "Foley Sound Synthesis at the DCASE 2023 Challenge," Proc. Detection and Classification of Acoustic Scenes and Events (DCASE), pp. 16-20, 2023.
Shunsuke Tsubaki, Yohei Kawaguchi, Keisuke Imoto, Tomoya Nishida, Kota Dohi, Takashi Endo, and Yuki Okamoto, "Audio-Change Captioning to Explain Machine-Sound Anomalies," Proc. Detection and Classification of Acoustic Scenes and Events (DCASE), pp. 201-205, 2023.
Yuki Okamoto, Kanta Shimonishi, Keisuke Imoto, Kota Dohi, Shota Horiguchi, and Yohei Kawaguchi, "CAPTDURE: Captioned Sound Dataset of Single Sources," Proc. INTERSPEECH, pp. 1683-1687, 2023.
Hien Ohnaka, Shinnosuke Takamichi, Keisuke Imoto, Yuki Okamoto, Kazuki Fujii and Hiroshi Saruwatari, "Visual Onoma-to-Wave: Environmental Sound Synthesis from Visual Onomatopoeias and Sound-Source Images," Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 1-5, 2023.
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Takahiro Fukumori, and Yoichi Yamashita, "How Should We Evaluate Synthesized Environmental Sounds," Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), pp. 307-312, 2022.
Yuki Okamoto, Shota Horiguchi, Masaaki Yamamoto, Keisuke Imoto, and Yohei Kawaguchi, "Environmental Sound Extraction using Onomatopoeic Words," Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 221-225, 2022. (第17回 IEEE Signal Processing Society (SPS) Japan Student Conference Paper Award)
Noriyuki Tonami, Keisuke Imoto, Ryotaro Nagase, Yuki Okamoto, Takahiro Fukumori, and Yoichi Yamashita, "Sound Event Detection Guided by Semantic Contexts of Scenes, " Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 801-805, 2022.
Noriyuki Tonami, Keisuke Imoto, Yuki Okamoto, Takahiro Fukumori, and Yoichi Yamashita, "Sound Event Detection Based on Curriculum Learning Considering Learning Difficulty of Events, "Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 875-879, 2021.
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori, and Yoichi Yamashita, "RWCP-SSD-Onomatopoeia: Onomatopoeic Word Dataset for Environmental Sound Synthesis," Proc. Detection and Classification of Acoustic Scenes and Events (DCASE), pp. 125-129, 2020.
Yuki Okamoto, Keisuke Imoto, Naoki Tsukahara, Ken Nagata, Koh Sueda, Ryosuke Yamanishi, and Yoichi Yamashita, "Crow Call Detection Using Gated Convolutional Recurrent Neural Network", Proc. RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP), pp. 171-174, 2020.
Yuki Okamoto, Keisuke Imoto, Tatsuya Komatsu, Shinnosuke Takamichi, Takumi Yagyu, Ryosuke Yamanishi and Yoichi Yamashita, "Overview of Tasks and Investigation of Subjective Evaluation Methods in Environmental Sound Synthesis and Conversion," Speech and Audio in the Northeast (SANE), 2019.
金森 勇介,岡本 悠希,高道 慎之介,齋藤 佑樹,猿渡 洋,"RELATE: 環境音と説明文の意味的関連性の自動評価に向けた主観評価データセットの構築," 第20回言語処理若手シンポジウム (YANS),2025.(第20回YANSシンポジウム スポンサー賞 (シェルパ・アンド・カンパニー株式会社賞))
関 健太郎,岡本 悠希,山岡 洸瑛,齋藤 佑樹,高道 慎之介,猿渡 洋,"ステレオ信号に対する空間情報を伴う音響キャプショニング," 第20回言語処理若手シンポジウム (YANS),2025.(第20回YANSシンポジウム スポンサー賞 (株式会社PKSHA Technology賞))
関 健太郎,伊藤 信貴,山内 一輝,岡本 悠希,山岡 洸瑛,齋藤 佑樹, 高道 慎之介,猿渡 洋,"パラ言語・非言語情報の記述文をクエリとした目的音声抽出," 日本音響学会2025年秋季研究発表会,pp. XXX-XXX,2025.
関 健太郎,岡本 悠希,山岡 洸瑛,齋藤 佑樹,高道 慎之介,猿渡 洋,"空間情報を伴う音響言語モデルの検討," 日本音響学会2025年秋季研究発表会,pp. XXX-XXX,2025.
岸 秀,阪井 瞭介,高道 慎之介,金森 勇介,岡本 悠希,"環境音埋め込みベクトル系列の類似度に基づく環境音生成の自動評価," 音学シンポジウム 2025,pp. XXX-XXX,2025.
岡本 悠希,金森 勇介,高野 大成,高道 慎之介,齋藤 佑樹,永瀬 亮太郎,猿渡 洋,"環境音と説明文の意味的関連性の自動評価に向けたデータセット構築と基本性能評価," 日本音響学会電気音響研究会/電子情報通信学会 応用音響研究会,2025.
高野 大成,岡本 悠希,齋藤 佑樹,"環境音合成における客観評価指標CLAPScoreの時系列評価性能の分析," 日本音響学会2025年春季研究発表会,pp. 285-288,2025.
濱田 誉輝,齋藤 佑樹,中田 亘,山内 一輝,関 健太郎,岡本 悠希,猿渡 洋,"ペルソナ説明文を利用した合成音声の話者性制御手法の検討," 日本音響学会2025年春季研究発表会,pp. 1043-1046,2025.
高道 慎之介,和田 仰,小川 諒,山岡 洸瑛,中田 亘,淺井 航平,関 健太郎,岡本 悠希,齋藤 佑樹,小川 哲司,猿渡 洋,中村 友彦,深山 覚,"音声・音響・音楽を扱うオープン基盤モデルの構築に向けたデータセット策定," 言語処理学会第31回年次大会,pp. 2692-2696,2025.
岡本 悠希,永瀬 亮太郎,井本 桂右,山岸 順一,齋藤 佑樹,福森 隆寛,山下 洋一,"環境音に対する印象説明文データセット," 電気情報通信学会研究報告(ショートオーラル),Vol. XX,No. XX,2025.
高野 大成,岡本 悠希,金森 勇介,齋藤 佑樹,永瀬亮太郎,猿渡 洋,"人間による知覚評価を反映したCLAPScoreの検討," 電気情報通信学会研究報告(ショートオーラル),Vol. XX,No. XX,2025.
金森 勇介,岡本 悠希,高野 大成,高道 慎之介,齋藤 佑樹,猿渡 洋,"Text-to-audioにおける入出力関連性の自動評価に向けた主観評価データセット構築(ショートオーラル)," 電気情報通信学会研究報告,Vol. XX,No. XX,2025.
高野 大成,岡本 悠希,斎藤 佑樹,"Text-to-audioにおける評価指標CLAP-Scoreの性能分析," 第19回言語処理若手シンポジウム (YANS),2024.(第19回YANSシンポジウム スポンサー賞 (株式会社IVRy賞))
岡本 悠希,永瀬 亮太郎,岡本 南美,齋藤 佑樹,福森 隆寛,山下 洋一," 環境音に対する印象説明文データセットの構築と分析," 日本音響学会2024年秋季研究発表会,pp. 339-342,2024.
(招待講演)岡本 悠希,"環境音合成の研究動向," 電気情報通信学会 信号処理研究会,p. 43,2024.(slide)
岡本 悠希,井本 桂右,高道 慎之介,永瀬 亮太郎,福森 隆寛,山下 洋一,"環境音の模倣音声を利用した環境音合成とデータセット構築," 日本音響学会電気音響研究会/電子情報通信学会 応用音響研究会,p. 22,2024.
Shunsuke Tsubaki, Yohei Kawaguchi, Keisuke Imoto, Tomoya Nishida, Kota Dohi, Takashi Endo, and Yuki Okamoto, "Audio-Change Captioning to Explain Machine-Sound Anomalies," 日本音響学会電気音響研究会/電子情報通信学会 応用音響研究会,p. 29-33,2024.
岡本 悠希,高道 慎之介,森松 亜依,渡邊 亞椰,井本 桂右,山下 洋一,"環境音に対する日本語自由記述文コーパスとベンチマーク分析," 言語処理学会第30回年次大会,pp. 1269-1273,2024.(言語処理学会第30回年次大会 (NLP2024) スポンサー賞 (Kotoba Technologies, Inc.))
岡本 悠希,井本 桂右,高道 慎之介,永瀬 亮太郎,福森 隆寛,山下 洋一,"環境音の模倣音声を用いた環境音合成の検討とデータセット構築," IDRユーザフォーラム,2023.
岡本 悠希,井本 桂右,高道 慎之介,永瀬 亮太郎,福森 隆寛,山下 洋一," Voice-to-foley: 環境音を模倣した音声を入力とする環境音合成," 日本音響学会2023年秋季研究発表会,pp. 1071-1074,2023.
岡本 悠希,井本 桂右,土肥 宏太,川口 洋平,"DCASECaps: 単一音源に説明文を付与した環境音データセット," 日本音響学会2023年春季研究発表会,pp. 133-136,2023.
大中 緋慧,高道 慎之介,井本 桂右,岡本 悠希,藤井 一貴,猿渡 洋,Visual onoma-to-wave: 画像オノマトペと音源画像を利用した環境音合成の提案,電子情報通信学会 音声研究会,pp. 78-82,2023.(第8回 IEEE Signal Processing Society (SPS) Tokyo Joint Chapter Student Award)
岡本 悠希,井本 桂右,高道 慎之介,福森 隆寛,山下 洋一,"環境音合成の入力情報に応じた主観評価手法の検討," 日本音響学会2022年秋季研究発表会,pp. 1257-1260,2022.
岡本 悠希,堀口 翔太,山本 正明,井本 桂右,川口 洋平,"擬音語を用いた環境音抽出," 日本音響学会2022年春季研究発表会,pp. 247-250,2022.
岡本 悠希,井本 桂右,高道 慎之介,福森 隆寛,山下 洋一,"環境音合成における主観評価手法の検討," 日本音響学会2022年春季研究発表会,pp. 1071-1074,2022.
砺波 紀之,井本 桂右,永瀬 亮太郎,岡本 悠希,福森 隆寛,山下 洋一,"事前定義されていないシーン情報を利用可能な音響イベント検出," 日本音響学会2022年春季研究発表会,pp. 243-246,2022.
井本 桂右,岡本 悠希,高道 慎之介,福森 隆寛,山下 洋一,"RWCP音声・音響データベースを用いた環境音・効果音合成の検討とオノマトペ拡張データセットの構築," IDRユーザフォーラム,2021.
岡本 悠希,井本 桂右,高道 慎之介,福森 隆寛,山下 洋一,"Transformerを用いたオノマトペからの環境音合成," 日本音響学会2021年秋季研究発表会,pp. 943-946,2021.
岡本 悠希,井本 桂右,高道 慎之介,山西 良典,福森 隆寛,山下 洋一,"Onoma-to-wave: オノマトペからの環境音合成手法の提案," 日本音響学会 2021年春季研究発表会,pp. 843-846,2021. (日本音響学会 第22回学生優秀発表賞,第5回 IEEE Signal Processing Society (SPS) Tokyo Joint Chapter Student Award)
岡本 悠希,井本 桂右,高道 慎之介,山西 良典,福森 隆寛,山下 洋一, "豊かな環境音の生成〜オノマトペを利用した環境音合成手法の提案〜," 日本音響学会 関西支部 第23回若手研究者交流研究発表会,2020.
岡本 悠希,井本 桂右,高道 慎之介,山西 良典,山下 洋一,"オノマトペを用いた環境音合成のためのデータセット構築とその分析," 日本音響学会 2020年春季研究発表会,pp. 1099-1102,2020.
岡本 悠希,井本 桂右,小松 達也,高道 慎之介,柳生 拓巳,山西 良典,山下 洋一,"多様な環境音の合成をめざして〜環境音合成における評価方法の検討〜," 日本音響学会 関西支部 第22回若手研究者交流研究発表会,2019.
岡本 悠希,柳生 拓巳,井本桂右,小松 達也,高道 慎之介,山西 良典,山下 洋一,"多様な環境音の合成と変換のための基礎検討," 日本音響学会 2019年秋季研究発表会, pp. 1003-1006,2019.
Daichi. Akiyama, Keisuke Imoto, Noriyuki Tonami, Yuki Okamoto, Ryosuke Yamanishi, Takahiro Fukumori, and Yoichi Yamashita, "Sound Event Detection Using Duration Robust Loss Function," arXiv preprint, arXiv:2006.15253, 2020.
Yuki Okamoto, Keisuke Imoto, Tatsuya Komatsu, Shinnosuke Takamichi, Takumi Yagyu, Ryosuke Yamanishi and Yoichi Yamashita, "Overview of Tasks and Investigation of Subjective Evaluation Methods in Environmental Sound Synthesis and Conversion", arXiv preprint, arXiv: 1908.10055, 2019.
井本 桂右,秋山 大知,岡本 悠希,山西 良典,山下 洋一, "音響モデル生成方法、音響分析方法、演算装置、及び、コンピュータプログラム," 特開2021-196432
Yuki Okamoto, "Environmental Sound Synthesis from onomatopoeic words," Talk on Sadaoki Furui Prize Papers Session at APSIPA ASC 2025, October 2025.
Yuki Okamoto, "Environmental Sound Synthesis from Various Input Information," Technical Seminar on Acoustic Scene and Event Analysis," Doshisha University, Kyoto, 17th October 2024.
岡本 悠希,"CAPTDURE: Captioned Sound Dataset of Single Sources," INTERSPEECH2023 読み会,2023年9月.
岡本 悠希,"Audio-Text Model Do Not Yet Leverage Natural Language," ICASSP2023 読み会,2023年7月.
岡本 悠希,"学振 特別研究員に採択されるためには," 立命館大学 日本学術振興会 特別研究員 申請・書き方ガイダンス," 2023年4月.
"執筆論文がトップカンファレンスに採択。長期インターン参加学生も、社員と変わらず活躍できる日立の魅力," Qiita zineインタビュー記事,2022年10月.
岡本 悠希,"【インターンレポート】擬音語テキストに基づく環境音抽出," Qiita,2022年6月.
岡本 悠希,"Environmental sound extraction using onomatopoeic words," ICASSP2022 読み会,2022年6月.
岡本 悠希,"学振 特別研究員に採択されるためには," 立命館大学 日本学術振興会 特別研究員 申請・書き方ガイダンス," 2022年4月.
岡本 悠希,"あらゆる音を柔軟に生成可能とする環境音合成の研究," 立命館大学ライスボールセミナー,2022年4月.