Publication

査読付き論文 (Journal papers)

Takaaki Saeki, Soumi Maiti, Xinjian Li, Shinji Watanabe, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Text-Inductive Graphone-Based Language Adaptation for Low-Resource Speech Synthesis," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. xxx, pp. xxxx--xxxx, Feb. 2024.
Detai Xin, Junfeng Jiang, Shinnosuke Takamichi, Yuki Saito, Akiko Aizawa, Hiroshi Saruwatari, "JVNV: A Corpus of Japanese Emotional Speech with Verbal Content and Nonverbal Expressions," IEEE Access, vol. xxx, no. xxx, 2024.
Detai Xin, Shinnosuke Takamichi, Hiroshi Saruwatari, "JNV Corpus: A Corpus of Japanese Nonverbal Vocalizations with Diverse Phrases and Emotions," Speech Communication, vol. xxx, no. xxx, 2024.
Takaaki Saeki, Shinnosuke Takamichi, Tomohiko Nakamura, Naoko Tanji, Hiroshi Saruwatari, "SelfRemaster: Self-Supervised Speech Restoration for Historical Audio Resources," IEEE Access, vol. xxx, no. xxx, 2024.
Xuan Luo, Shinnosuke Takamichi, Yuki Saito, Tomoki Koriyama, Hiroshi Saruwatari, "Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence," APSIPA Transactions, 2023.
竹内雅樹，副島裕太郎，安在帥，李根学，高木健，伊福部達，藪謙一郎，高道慎之介，関野正樹，"線形予測法(LPC)残差波を用いて自然発声に近い音声を得るハンズフリー型電気式人工喉頭の開発，” 電気学会論文誌A，Vol. 142, No. 9, 2022.
Masaki Takeuchi, Jaesol Ahn, Kunhak Lee, Ken Takaki, Tohru Ifukube, Ken-ichiro Yabu, Shinnosuke Takamichi, Rumi Ueha, Masaki Sekino, "Hands-Free Wearable Electrolarynx using LPC Residual Waves and Listening Evaluation," Advanced Biomedical Engineering, Vol. **, pp.***--***, ***, 2022.
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori, and Yoichi Yamashita, "Onoma-to-wave: Environmental sound synthesis from onomatopoeic words," APSIPA transactions on signal and information processing, Vol. **, pp.***--***, ***, 2022.
Hiroto Kai, Shinnosuke Takamichi, Sayaka Shiota, Hitoshi Kiya, "Lightweight and irreversible speech pseudonymization based on data-driven optimization of cascaded voice modification modules," Computer Speech & Language, Vol. **, pp.***--***, ***, 2022.
Satoshi Mizoguchi, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari, "DNN-based low-musical-noise single-channel speech enhancement based on higher-order-moments matching," IEICE Transactions on Information and Systems, Vol.E***-*, No.**, pp.***--***, ***. 2021.
Takaaki Saeki, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Incremental Text-to-Speech Synthesis Using Pseudo Lookahead with Large Pretrained Language Model," IEEE Signal Processing Letters, Vol. **, No. **, pp. **--**, ***. 2021. 第37回電気通信普及財団賞 (テレコムシステム技術学生賞)
Takaaki Saeki, Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Real-time full-band voice conversion with sub-band modeling and data-driven phase estimation of spectral differentials," IEICE Transactions on Information and Systems, Vol.E104-D, No.7, pp.1002--1016, Jul. 2021. 2021年度電子情報通信学会論文賞
Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Perceptual-similarity-aware deep speaker representation learning for multi-speaker generative modeling," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 29, pp. 1033--1048, Feb. 2021.
Akihito Aiba, Minoru Yoshida, Daichi Kitamura, Shinnosuke Takamichi, Hiroshi Saruwatari, "Noise Robust Acoustic Anomaly Detection System with Nonnegative Matrix Factorization Based on Generalized Gaussian Distribution," IEICE Transactions on Information and Systems, Vol.E***-*, No.**, pp.***--***, ***. 2021.
Yuki Saito, Taiki Nakamura, Yusuke Ijima, Kyosuke Nishida, and Shinnosuke Takamichi, "Non-parallel and many-to-many voice conversion using variational autoencoders integrating speech recognition and speaker verification," Acoustical Science and Technology, Vol.42, No.1, pp.1--11, Jan. 2021.
Junya Koguchi, Shinnosuke Takamichi, Masanori Morise, Hiroshi Saruwatari, and Shigeki Sagayama, "DNN-based full-band speech synthesis using GMM approximation of spectral envelope," IEICE Transactions on Information and Systems, Vol.E103-D, No.12, pp.2673--2681, Dec. 2020.
Masashi Aso, Shinnosuke Takamichi, Norihiro Takamune, and Hiroshi Saruwatari, "Acoustic model-based subword tokenization and prosodic-context extraction without language knowledge for text-to-speech synthesis," Speech Communication, Vol. 125, pp.53--60, Sep. 2020. Selected as "Most popular articles" of the Journal
Hiroki Tamaru, Shinnosuke Takamichi, Hiroshi Saruwatari, "Perception analysis of inter-singer similarity in Japanese song," Acoustical Science and Technology, Vol.41, No.5, pp.804--807, Sep. 2020.
Shinnosuke Takamichi, Ryosuke Sonobe, Kentaro Mitsui, Yuki Saito, Tomoki Koriyama, Naoko Tanji, Hiroshi Saruwatari, "JSUT and JVS: free Japanese voice corpora for accelerating speech synthesis research," Acoustical Science and Technology, Vol.41, No.5, pp.761--768, Sep. 2020.
Hiroki Tamaru, Yuki Saito, Shinnosuke Takamichi, Tomoki Koriyama, Hiroshi Saruwatari, "Generative moment matching network-based neural double-tracking for synthesized and natural singing voices," IEICE Transactions on Information and Systems, Vol.E103-D, No.3, pp.639--647, Mar. 2020.
Shinnosuke Takamichi, Yuki Saito, Norihiro Takamune, Daichi Kitamura, Hiroshi Saruwatari, "Phase Reconstruction from Amplitude Spectrograms Based on Directional-Statistics Deep Neural Networks," Signal Processing, Vol. 169, pp. 107368, Apr. 2020. Selected as "Most popular articles" of the Journal
Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Vocoder-free text-to-speech synthesis incorporating generative adversarial networks using low-/multi-frequency STFT amplitude spectra," Computer Speech & Language, Vol. 58, pp.347--363 , Nov. 2019. Selected as "Most popular articles" of the Journal
Naoki Makishima, Shinichi Mogami, Norihiro Takamune, Daichi Kitamura, Hayato Sumino, Shinnosuke Takamichi, Hiroshi Saruwatari, and Nobutaka Ono, "Independent Deeply Learned Matrix Analysis for Determined Audio Source Separation," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 27, No. 10, pp. 1601--1615 , Oct. 2019. IEEE SPS Japan Student Journal Paper Award
Daiki Sekizawa, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Prosody correction preserving speaker individuality for Chinese-accented Japanese HMM-based text-to-speech synthesis," IEICE Transactions on Information and Systems, Vol.E102-D, No.6, pp.1218--1221, Jun. 2019.
Norihide Maikusa, Ryousuke Sonobe, Setsuo Kinoshita, Nobutake Kawada, Susumu Yagishi, Tadashi Masuoka, Toru Kinoshita, Shinnosuke Takamichi, Akira Homma, "Automatic detection of Alzheimer’s dementia using speech features of the revised Hasegawa’s Dementia Scale," Geriatric Medicine, Vol. 57, No. 2, pp. 1117--1125, 2019.
Shinnosuke Takamichi and Daisuke Morikawa, "Perceived azimuth-based creditability and self-reported confidence for sound localization experiments using crowdsourcing," Acoustical Science and Technology, Vol. 40, No. 2, pp. 142--143, Mar. 2019.
Takatomo Kano, Shinnosuke Takamichi, Sakriani Sakti, Graham Neubig, Tomoki Toda, and Satoshi Nakamura,"An End-to-end Model for Cross-Lingual Transformation of Paralinguistic Information," Machine Translation, pp. 1--16, Apr. 2018.
Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Statistical Parametric Speech Synthesis Incorporating Generative Adversarial Networks," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 26, No. 1, pp. 84--96, Jan. 2018. (preprint) 2020 IEEE SPS Young Author Best Paper Award, 第34回電気通信普及財団テレコムシステム技術学生賞, IEEE SPS Japan Student Journal Paper Award, selected as "Most popular articles" of the Journal
Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Voice Conversion Using Input-to-Output Highway Networks," IEICE Transactions on Information and Systems, Vol.E100-D, No.8, pp.1925--1928, Aug. 2017.
Yuji Oshima, Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, "Non-Native Text-To-Speech Preserving Speaker Individuality Based on Partial Correction of Prosodic and Phonetic Characteristics," IEICE Transactions on Information and Systems, Vol.E99-D, No.12, pp. 3132-3139, Dec. 2016.
Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, "A statistical sample-based approach to GMM-based voice conversion using tied-covariance acoustic models," IEICE Transactions on Information and Systems, Vol.E99-D, No.10, pp. 2490--2498, Oct. 2016.
Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, ”Post-filters to Modify the Modulation Spectrum for Statistical Parametric Speech Synthesis,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 24, No. 4, pp. 755--767, Apr. 2016. 日本音響学会独創研究奨励賞板倉記念対象論文, IEEE SPS Japan Young Author Best Paper Award
Shinnosuke Takamichi, Tomoki Toda, Yoshinori Shiga, Sakriani Sakti, Graham Neubig, and Satoshi Nakamura, "Parameter Generation Methods with Rich Context Models for High-Quality and Flexible Text-To-Speech Synthesis," IEEE Journal of Selected Topics of Speech Processing, Vol. 8, No. 2, pp. 239--250, Apr. 2014.(speech samples) IEEE関西支部学生研究奨励賞, 第30回電気通信普及財団テレコムシステム技術学生賞
高道慎之介, 穗刈治英, 島田正治, "頭部球モデルにおけるHRTFの最小位相化の有効性に関する一検討," 電子情報通信学会論文誌(A), Vol. 94-A, No. 6, pp. 449-452, 2011.

Google Sites

Report abuse