Jee-weon Jung, Wangyou Zhang, Soumi Maiti, Yihan Wu, Xin Wang, Ji-Hoon Kim, Yuta Matsunaga, Seyun Um, Jinchuan Tian, Hye-jin Shim, Nicholas Evans, Joon Son Chung, Shinnosuke Takamichi, Shinji Watanabe, “The text-to-speech in the wild (TITW) dataset,” in Proc. Interspeech, Aug. 2025. [arXiv] [official page]
Jee-weon Jung, Yihan Wu, Xin Wang, Ji-Hoon Kim, Soumi Maiti, Yuta Matsunaga, Hye-jin Shim, Jinchuan Tian, Nicholas Evans, Joon Son Chung, Wangyou Zhang, Seyun Um, Shinnosuke Takamichi, and Shinji Watanabe, "SpoofCeleb: Speech Deepfake Detection and SASV in the Wild," in IEEE Open Journal of Signal Processing, vol. 6, pp. 68-77, 2025. [arXiv] [doi] [official page]
Yasushige Ishikawa, Shinnosuke Takamichi, Yuta Matsunaga, Yusuke Yoshikawa, and Shigeo Fujiwara, "Speaking Practice Using Text-to-speech Technology: Japanese EFL Learners' Perceptions," in Proc. WorldCALL, Nov. 2023.
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari, "Improving robustness of spontaneous speech synthesis with linguistic speech regularization and pseudo-filled-pause insertion," in Proc. 12th ISCA SSW, Aug. 2023. [arXiv] [demo]
Takatoyo Umemoto, Shinnosuke Takamichi, Yuta Matsunaga, Yusuke Yoshikawa, Kikuko Yui, Kishio Sakamoto, Shigeo Fujiwara, Yasushige Ishikawa, "Effects of text-to-speech synthesized speech on learners' presentation anxiety and self-efficacy: A comparison of two models," in Proc. EUROCALL, Aug. 2023. [doi]
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari, "Empirical Study Incorporating Linguistic Knowledge on Filled Pauses for Personalized Spontaneous Speech Synthesis," in Proc. APSIPA ASC, Nov. 2022, pp. 1898-1903. [arXiv] [demo] [GitHub]
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari, "Personalized Filled-pause Generation with Group-wise Prediction Models," in Proc. LREC, Jun. 2022, pp. 385-392. [arXiv] [GitHub]
松永 裕太,高道 慎之介,上乃 聖,猿渡 洋,“Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習,” 日本音響学会第151回(2024年春季)研究発表会, Mar. 2024.
大西 弘太郎,松永 裕太,園部 良介,”音声合成モデルを用いた音声編集の検討,” 日本音響学会第150回(2023年秋季)研究発表会, Sep. 2023. (株式会社ディー・エヌ・エーでのインターンによる成果)
松永 裕太,佐伯 高明,高道 慎之介,猿渡 洋,”フィラーを含む自発音声合成モデルの品質低下原因の調査と一貫性保証による改善,” 日本音響学会第148回(2022年秋季)研究発表会, Sep. 2022.
松永 裕太,寺島 涼,橘 健太郎,”微分可能な信号処理に基づく音声合成器を用いた DNN 音声パラメータ推定の検討,” 日本音響学会第148回(2022年秋季)研究発表会, Sep. 2022. (LINE株式会社でのインターンによる成果)
松永 裕太,佐伯 高明,高道 慎之介,猿渡 洋,”個人別自発音声合成の実現に向けたフィラーの言語学的知識に基づく実験的研究,” 情報処理学会研究報告, 2022-SLP-140, No. 31, pp. 1-6, Mar. 2022.
松永 裕太,佐伯 高明,高道 慎之介,猿渡 洋,”講演音声におけるフィラーの出現傾向と個人性に関する分析,” 日本音声学会第35回全国大会, Sep. 2021.
村上 存,久禮 達也,松永 裕太,”デザインの上流段階における機能・ユーザ体験記述の計算機処理によるデザイン発想創出の試み,” 日本機械学会論文集, 2021. (卒論の成果)
第35回日本音声学会全国大会 優秀発表賞
対象論文:松永裕太,佐伯高明,高道 慎之介,猿渡洋,”講演音声におけるフィラーの出現傾向と個人性に関する分析,” 日本音声学会第35回全国大会, Sep. 2021.
第25回日本音響学会 学生優秀発表賞
対象論文:松永 裕太,寺島 涼,橘 健太郎,”微分可能な信号処理に基づく音声合成器を用いた DNN 音声パラメータ推定の検討,” 日本音響学会第148回(2022年秋季)研究発表会, Sep. 2022.
JLecSponSpeech is the corpus consisting of transcription of lectures in the University of Tokyo. This corpus is available for research of spontaneous speech synthesis etc.
東京大学における講義の書き起こしデータです.非流暢性のタグなどの情報が含まれており,自発音声合成 (spontaneous speech synthesis) の研究などに利用可能です.