Publication

国際会議 (International conferences)

Xinjian Li, Shinnosuke Takamichi, Takaaki Saeki, William Chen, Sayaka Shiota, Shinji Watanabe, "YODAS: Youtube-Oriented Dataset for Audio and Speech," Proc. ASRU, Dec. 2023.
Aya Watanabe, Shinnosuke Takamichi, Yuki Saito, Wataru Nakata, Detai Xin, Hiroshi Saruwatari, "Coco-Nut: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-based Control," Proc. ASRU, Dec. 2023.
Yasushige Ishikawa, Shinnosuke Takamichi, Yuta Matsunaga, Yusuke Yoshikawa, and Shigeo Fujiwara, "Speaking Practice Using Text-to-speech Technology: Japanese EFL Learners' Perceptions, " WorldCALL, Nov. 2023.
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari, "Improving robustness of spontaneous speech synthesis with linguistic speech regularization and pseudo-filled-pause insertion," Proc. ISCA SSW, Sep. 2023.
Joonyong Park, Shinnosuke Takamichi, Tomohiko Nakamura, Kentaro Seki, Detai Xin, Hiroshi Saruwatari, "How generative spoken language model encodes noisy speech: investigation from phonetics to syntactics," INTERSPEECH, Dublin, Ireland, Aug. 2023.
Detai Xin, Shinnosuke Takamichi, Ai Morimatsu, Hiroshi Saruwatari, "Laughter synthesis using pseudo phonetic tokens with a large-scale in-the-wild laughter corpus," INTERSPEECH, Dublin, Ireland, Aug. 2023.
Yota Ueda, Shinnosuke Takamichi, Yuki Saito, Norihiro Takamune, Hiroshi Saruwatari, "HumanDiffusion: diffusion model using perceptual gradients," INTERSPEECH, Dublin, Ireland, Aug. 2023. (preprint)
Yuki Saito, Eiji Iimori, Shinnosuke Takamichi, Kentaro Tachibana, Hiroshi Saruwatari, "CALLS: Japanese empathetic dialogue speech corpus of complaint handling and attentive listening in customer center," INTERSPEECH, Dublin, Ireland, Aug. 2023.
Yuki Saito, Shinnosuke Takamichi, Eiji Iimori, Kentaro Tachibana, Hiroshi Saruwatari, "ChatGPT-EDSS: empathetic dialogue speech synthesis trained from ChatGPT-derived context word embeddings," INTERSPEECH, Dublin, Ireland, Aug. 2023.
Keunwoo Choi, Jaekwon Im, Laurie Heller, Brian McFee, Keisuke Imoto, Yuki Okamoto, Mathieu Lagrange, Shinnosuke Takamichi, "Foley Sound Synthesis at the DCASE 2023 Challenge," DCASE Challenge 2023, May 2023.
Takaaki Saeki, Soumi Maiti, Xinjian Li, Shinji Watanabe, Shinnosuke Takamichi, Hiroshi Saruwatari, "Learning to Speak from Text: Zero-Shot Multilingual Text-to-Speech with Unsupervised Text Pretraining," Proc. IJCAI, Macao, Aug. 2023.
Takatoyo Umemoto, Shinnosuke Takamichi, Yuta Matsunaga, Yusuke Yoshikawa, Kikuko Yui, Kishio Sakamoto, Shigeo Fujiwara, Yasushige Ishikawa, "Effects of text-to-speech synthesized speech on learners’ presentation anxiety and self-efficacy: A comparison of two models," Proc. EUROCALL, Iceland, Aug. 2023.
Hien Ohnaka, Shinnosuke Takamichi, Keisuke Imoto, Yuki Okamoto, Kazuki Fujii, Hiroshi Saruwatari, "Visual onoma-to-wave: environmental sound synthesis from visual onomatopoeias and sound-source images", Proc. ICASSP, Greece, Jun. 2023.
Aya Watanabe, Shinnosuke Takamichi, Yuki Saito, Detai Xin, Hiroshi Saruwatari, "Mid-attribute Speaker Generation using Optimal-Transport-based Interpolation of Gaussian Mixture Models," Proc. ICASSP, Greece, Jun. 2023.
Detai Xin, Sharath Adavanne, Federico Ang, Ashish Kulkarni, Shinnosuke Takamichi, Hiroshi Saruwatari, "Improving Speech Prosody of Audiobook Text-to-Speech Synthesis with Acoustic and Textual Contexts," Proc. ICASSP, Greece, Jun. 2023.
Kentaro Seki, Shinnosuke Takamichi, Takaaki Saeki, Hiroshi Saruwatari, "Text-to-speech synthesis from dark data with evaluation-in-the-loop data selection," Proc. ICASSP, Greece, Jun. 2023. [ICASSP2023 Travel Grant Award]
Tomohiko Nakamura, Shinnosuke Takamichi, Naoko Tanji, Satoru Fukayama, Hiroshi Saruwatari, "jaCappella Corpus: A Japanese a Cappella Vocal Ensemble Corpus," Proc. ICASSP, Greece, Jun. 2023.
Kota Arai, Yutaro Hirao, Takuji Narumi, Tomohiko Nakamura, Shinnosuke Takamichi, and Shigeo Yoshida, "TimToShape: Supporting Practice of Musical Instruments by Visualizing Timbre with 2D Shapes based on Crossmodal Correspondences," Proc. IUI, U.S.A., Mar. 2023.
Yoshifumi Nakano, Takaaki Saeki, Shinnosuke Takamichi, Katsuhito Sudoh, Hiroshi Saruwatari, "vTTS: visual-text to speech," IEEE SLT, Doha, Qatar, Jan. 2023.
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Takahiro Fukumori, Yoichi Yamashita, "How Should We Evaluate Synthesized Environmental Sounds," APSIPA ASC pp. ****-****, Thailand, Nov. 2022.
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari, "Empirical Study Incorporating Linguistic Knowledge on Filled Pauses for Personalized Spontaneous Speech Synthesis," APSIPA ASC pp. ****-****, Thailand, Nov. 2022.
Wataru Nakata, Tomoki Koriyama, Shinnosuke Takamichi, Yuki Saito, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari, "Predicting VQVAE-based Character Acting Style from Quotation-Annotated Text for Audiobook Speech Synthesis," Proc. Interspeech, Korea, Sep. 2022.
Yuto Nishimura, Yuki Saito, Shinnosuke Takamichi, Kentaro Tachibana and Hiroshi Saruwatari, "Acoustic Modeling for End-to-End Empathetic Dialogue Speech Synthesis Using Linguistic and Prosodic Contexts of Dialogue History," Proc. Interspeech, Korea, Sep. 2022. [Google Travel Grants for Students in East Asia]
Yuki Saito, Yuto Nishimura, Shinnosuke Takamichi, Kentaro Tachibana and Hiroshi Saruwatari, "STUDIES: Corpus of Japanese Empathetic Dialogue Speech Towards Friendly Voice Agent," Proc. Interspeech, Korea, Sep. 2022.
Takaaki Saeki, Detai Xin, Wataru Nakata, Tomoki Koriyama, Shinnosuke Takamichi, Hiroshi Saruwatari, "UTMOS: UTokyo-SaruLab System for VoiceMOS Challenge 2022," Proc. Interspeech, Korea, Sep. 2022. [Ranked 1st in 10/16 metrics]
Takaaki Saeki, Shinnosuke Takamichi, Tomohiko Nakamura, Naoko Tanji and Hiroshi Saruwatari, "SelfRemaster: Self-Supervised Speech Restoration with Analysis-by-Synthesis Approach Using Channel Modeling," Proc. Interspeech, Korea, Sep. 2022. [Google Travel Grants for Students in East Asia]
Shinnosuke Takamichi, Wataru Nakata, Naoko Tanji, and Hiroshi Saruwatari, "J-MAC: Japanese multi-speaker audiobook corpus for speech synthesis," Proc. Interspeech, Korea, Sep. 2022.
Detai Xin, Shinnosuke Takamichi, and Saruwatari Hiroshi, "Exploring the Effectiveness of Self-supervised Learning and Classifier Chains in Emotion Recognition of Nonverbal Vocalizations," Proc. ICML ExVo Workshop, pp. xxxx-xxxx, Jul. 2022. [Ranked 1st in few-shot task]
Hiroto Kai, Shinnosuke Takamichi, Sayaka Shiota and Hitoshi Kiya, "Robustness of signal processing-based pseudonymization method against decryption attack," Proc. Odyssey, pp. xxxx-xxxx, xxx, June 2022.
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Personalized filled-pause generation with group-wise prediction models," Proc. LREC, pp. xxxx-xxxx, xxx, June 2022.
Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari, "Low-Latency Incremental Text-to-Speech Synthesis with Distilled Context Prediction Network," Proc. ASRU, pp. xxxx-xxxx, Dec. 2021.
Xuan Luo, Shinnosuke Takamichi, Tomoki Koriyama, Yuki Saito, Hiroshi Saruwatari, "Emotion-Controllable Speech Synthesis Using Emotion Soft Labels and Fine-Grained Prosody Factors," Proc. APSIPA ASC, pp. xxxx-xxxx, Tokyo, Japan, Dec. 2021. (project_page)
Riku Arakawa, Zendai Kashino, Shinnosuke Takamichi, Adrien Alexandre Verhulst, Masahiko Inami, "Digital Speech Makeup: Voice Conversion Based Altered Auditory Feedback for Transforming Self-Representation," Proc. ACM ICMI, Oct. 2021.
Rei Ominato, Naoki Wakui, Shinnosuke Takamichi, Shohei Yano, "Discriminating between left and right ears using linear and nonlinear dimensionality reduction," SmaSys, Yamagata, Oct. 2021.
Wataru Nakata, Tomoki Koriyama, Shinnosuke Takamichi, Naoko Tanji, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari, "Audiobook Speech Synthesis Conditioned by Cross-Sentence Context-Aware Word Embeddings," Proc. The 11th ISCA SSW, Online, Aug. 2021. (project page)
Kazuya Yufune, Tomoki Koriyama, Shinnosuke Takamichi and Hiroshi Saruwatari, "Accent Modeling of Low-Resourced Dialect in Pitch Accent Language Using Variational Autoencoder" Proc. The 11th ISCA SSW, Online, Aug. 2021.
Detai Xin, Yuki Saito, Shinnosuke Takamichi, Tomoki Koriyama and Hiroshi Saruwatari, "Cross-lingual speaker adaptation using domain adaptation and speaker consistency loss for text-to-speech synthesis," Proc. Interspeech, pp. XXXX--XXXX, Brno, Czech Republic, Aug. 2021.
Yota Ueda, Kazuki Fujii, Yuki Saito, Shinnosuke Takamichi, Yukino Baba, Hiroshi Saruwatari, "HumanACGAN: conditional generative adversarial network with human-based auxiliary classifier and its evaluation in phoneme perception," Proc. ICASSP, pp. xxxx--xxxx, Tronto, Canada, Jun. 2021.
Detai Xin, Tatsuya Komatsu, Shinnosuke Takamichi, Hiroshi Saruwatari, "Disentangled speaker and language representations using mutual information minimization and domain adaptation for cross-lingual TTS," Proc. ICASSP, pp. xxxx--xxxx, Tronto, Canada, Jun. 2021.
Yasushige Ishikawa, Shinnosuke Takamichi, Takatoyo Umemoto, Masao Aikawa, Kishio Sakamoto, Kikuko Yui, Shigeo Fujiwara, Ayako Suto, Koichi Nishiyama, "Japanese EFL learners’ speaking practice utilizing text-to-speech technology within a team-based flipped learning framework," HCI International 2021, virtual conference, Jul. 2021.
Hiroto Kai, Shinnosuke Takamichi, Sayaka Shiota, Hitoshi Kiya, "Lightweight voice anonymization based on data-driven optimization of cascaded voice modification modules," Proc. IEEE SLT, pp. ***--***, Shenzhen, China, Jun. 2021.
Junya Koguchi, Shinnosuke Takamichi, Masanori Morise, "PJS: phoneme-balanced Japanese singing-voice corpus," Proc. APSIPA, pp. 487--491, Auckland, New Zealand, Dec. 2020. (arXiv)
Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori, Yoichi Yamashita, "RWCP-SSD-Onomatopoeia: Onomatopoeic Word Dataset for Environmental Sound Synthesis," DCASE workshop, pp. 125--129, Tokyo, Japan, Nov. 2020.
Detai Xin, Yuki Saito, Shinnosuke Takamichi, Tomoki Koriyama and Hiroshi Saruwatari, "Cross-lingual Text-To-Speech Synthesis via Domain Adaptation and Perceptual Similarity Regression in Speaker Space," Proc. Interspeech, pp. 2947--2951, Shanghai, China, Oct. 2020.
Masashi Aso, Shinnosuke Takamichi, and Hiroshi Saruwatari, "End-to-end text-to-speech synthesis with unaligned multiple language units based on attention," Proc. Interspeech, pp. 4009--4013, Shanghai, China, Oct. 2020.
Yuki Yamashita, Tomoki Koriyama, Yuki Saito, Shinnosuke Takamichi, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari, "Investigating Effective Additional Contextual Factors in DNN-based Spontaneous Speech Synthesis," Proc. Interspeech, pp. 3201--3205, Shanghai, China, Oct. 2020.
Takaaki Saeki, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari, "Real-time, full-band, online DNN-based voice conversion using a single CPU," Proc. Interspeech, pp. 1021--1022, Shanghai, China, Oct. 2020.
Yuki Yamashita, Tomoki Koriyama, Yuki Saito, Shinnosuke Takamichi, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari, "DNN-based Speech Synthesis Using Abundant Tags of Spontaneous Speech Corpus," Proc. LREC, pp. 6440--6445, Marseille, France, May 2020.
Yuki Saito, Shinnosuke Takamichi and Hiroshi Saruwatari, "SMASH Corpus: A Spontaneous Speech Corpus Recording Third-person Audio Commentaries on Gameplay," Proc. LREC, pp. 6573--6579, Marseille, France, May 2020.
Rei Okamoto, Shohei Yano, Naoki Wakui, and Shinnosuke Takamichi, "Visualization of differences in ear acoustic characteristics using t-SNE," Proc. AES convention, pp. 10350, Vienna, Austria, May 2020.
Takaaki Saeki, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari, "Lifter training and sub-band modeling for computationally efficient and high-quality voice conversion using spectral differentials," Proc. ICASSP, pp. 7784--7788, Barcelona, Spain, May 2020.
Kazuki Fujii, Yuki Saito, Shinnosuke Takamichi, Yukino Baba, Hiroshi Saruwatari, "HumanGAN: generative adversarial network with human-based discriminator and its evaluation in speech perception modeling," Proc. ICASSP, pp. 6239--6243, Barcelona, Spain, May 2020. (preprint) フジサンケイビジネスアイ先端技術大賞特別賞主要論文
Yuki Okamoto, Keisuke Imoto, Tatsuya Komatsu, Shinnosuke Takamichi, Takumi Yagyu, Ryosuke Yamanishi, Yoichi Yamashita, "Overview of Tasks and Investigation of Subjective Evaluation Methods in Environmental Sound Synthesis and Conversion," Proc. SANE, New York, U.S.A., Oct. 2019.
Riku Arakawa, Shinnosuke Takamichi and Hiroshi Saruwatari, "TransVoice: Real-Time Voice Conversion for Augmenting Near-Field Speech Communication" UIST poster, SNew Orleans, U.S.A., Oct. 2019.
Tomoki Koriyama, Shinnosuke Takamichi and Takao Kobayashi, "Sparse Approximation of Gram Matrices for GMMN-based Speech Synthesis," Proc. The 10th ISCA SSW, Vienna, Austria, Sep. 2019.
Masashi Aso, Shinnosuke Takamichi, Norihiro Takamune and Hiroshi Saruwatari, "Subword tokenization based on DNN-based acoustic model for end-to-end prosody generation," Proc. The 10th ISCA SSW, Vienna, Austria, Sep. 2019. (poster)
Riku Arakawa, Shinnosuke Takamichi and Hiroshi Saruwatari, "Implementation of DNN-based real-time voice conversion and its improvements by audio data augmentation and mask-shaped device," Proc. The 10th ISCA SSW, Vienna, Austria, Sep. 2019. (poster)
Yuki Saito, Shinnosuke Takamichi and Hiroshi Saruwatari, "DNN-based Speaker Embedding Using Subjective Inter-speaker Similarity for Multi-speaker Modeling in Speech Synthesis," Proc. The 10th ISCA SSW, Vienna, Austria, Sep. 2019. (poster)
Taiki Nakamura, Yuki Saito, Shinnosuke Takamichi, Yusuke Ijima and Hiroshi Saruwatari, "V2S attack: building DNN-based voice conversion from automatic speaker verification," Proc. The 10th ISCA SSW, Vienna, Austria, Sep. 2019. (poster)
Ivan Halim Parmonangan, Hiroki Tanaka, Sakti Sakriani, Shinnosuke Takamichi, Satoshi Nakamura, "Speech Quality Evaluation of Synthesized Japanese Speech using EEG," Proc. Interspeech, pp. ***-***, Graz, Austria, Jul. 2019.
Ivan Halim Parmonangan, Hiroki Tanaka, Sakti Sakriani, Shinnosuke Takamichi, Satoshi Nakamura, "EEG Analysis towards Evaluating Synthesized Speech Quality," Proc. IEEE EMBC, pp. ***-***, Berlin, Germany, Jul. 2019.
Kana Naruse, Shigeo Yoshida, Shinnosuke Takamichi, Takuji Narumi, Tomohiro Tanikawa, Michitaka Hirose, "Estimating Confidence in Voices using Crowdsourcing for Alleviating Tension with Altered Auditory Feedback," Asian CHI Symposium: Emerging HCI Research Collection in ACM Conference on Human Factors in Computing Systems (CHI), Glasgow, United Kingdom, May 2019.
Hiroki Tamaru, Yuki Saito, Shinnosuke Takamichi, Tomoki Koriyama, and Hiroshi Saruwatari, "Generative moment matching network-based random modulation post-filter for DNN-based singing voice synthesis and neural double-tracking," Proc. ICASSP, pp. 7070--7074, Brighton, United Kingdom, May 2019. (preprint) (poster)
Koichiro Yoshino, Yukitoshi Murase, Nurul Lubis, Kyoshiro Sugiyama, Hiroki Tanaka, Sakti Sakriani, Shinnosuke Takamichi, and Satoshi Nakamura, "Spoken Dialogue Robot for Watching Daily Life of Elderly People," Proc. IWSDS, pp. ***-***, Sicily, Italy, Apr. 2019.
Takanori Akiyama, Shinnosuke Takamichi, Hiroshi Saruwatari, "Prosody-aware subword embedding considering Japanese intonation systems and its application to DNN-based multi-dialect speech synthesis," Proc. APSIPA, pp. 659--664 , Hawaii, U.S.A., Nov. 2018. (slide)
Hitoshi Suda, Gaku Kotani, Shinnosuke Takamichi, Daisuke Saito, "A revisit to feature handling for high-quality voice conversion," Proc. APSIPA, pp. 816--822 , Hawaii, U.S.A., Nov. 2018. (slide)
Masakazu Une, Yuki Saito, Shinnosuke Takamichi, Daichi Kitamura, Ryoichi Miyazaki, Hiroshi Saruwatari, "Generative approach using the noise generation models for DNN-based speech synthesis trained from noisy speech," Proc. APSIPA, pp. 99--103, Hawaii, U.S.A., Nov. 2018. (slide) Invited special session
Sayaka Shiota, Shinnosuke Takamichi, Tomoko Matsui, "Data augmentation with moment-matching networks for i-vector based speaker verification," Proc. APSIPA, pp. 345--349, Hawaii, U.S.A., Nov. 2018. Invited special session
Shinnosuke Takamichi, Yuki Saito, Norihiro Takamune, Daichi Kitamura, and Hiroshi Saruwatari, "Phase reconstruction from amplitude spectrograms based on von-Mises-distribution deep neural network," Proc. IWAENC, pp. 286--290, Tokyo, Japan, Sep. 2018. (preprint) (poster)
Shinichi Mogami, Hayato Sumino, Daichi Kitamura, Norihiro Takamune, Shinnosuke Takamichi, Hiroshi Saruwatari, and Nobutaka Ono, "Independent Deeply Learned Matrix Analysis for Multichannel Audio Source Separation," Proc. EUSIPCO, pp. 1571--1575, Rome, Italy, Sep. 2018. (accepted) (preprint) Invited special session
Shinnosuke Takamichi, and Hiroshi Saruwatari, "CPJD Corpus: Crowdsourced Parallel Speech Corpus of Japanese Dialects," Proc. LREC, pp. 434--437, Miyazaki, Japan, May 2018. (poster)
Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Text-to-speech synthesis using STFT spectra based on low-/multi-resolution generative adversarial networks," Proc. ICASSP, pp. 5299--5303, Calgary, Canada, Apr. 2018. (poster)
Yuki Saito, Yusuke Ijima, Kyosuke Nishida, and Shinnosuke Takamichi, "Non-parallel voice conversion using variational autoencoders conditioned by phonetic posteriorgrams and d-vectors," Proc. ICASSP, pp. 5274--5278, Calgary, Canada, Apr. 2018. (poster) Grants from NEC C&C Foundation, Outstanding Paper Award for Young C&C Researchers
Shinnosuke Takamichi, "Modulation spectrum-based speech parameter trajectory smoothing for DNN-based speech synthesis using FFT spectra," Proc. APSIPA ASC, Kuala Lumpur, Malaysia, Dec. 2017. (slide) Invited special session
Shinnosuke Takamichi, Daisuke Saito, Hiroshi Saruwatari, and Nobuaki Minematsu, "The UTokyo speech synthesis system for Blizzard Challenge 2017," Proc. Blizzard Challenge Workshop, Stockholm, Sweden, Aug. 2017.
Hiroyuki Miyoshi, Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Voice Conversion Using Sequence-to-Sequence Learning of Context Posterior Probabilities," Proc. INTERSPEECH, pp. 1268--1272, Stockholm, Sweden, Aug. 2017. (preprint) (slide) (speech_samples)
Shinnosuke Takamichi, Tomoki Koriyama, and Hiroshi Saruwatari, "Sampling-based speech parameter generation using moment-matching network," Proc. INTERSPEECH, pp. 3961--3965, Stockholm, Sweden, Aug. 2017. (preprint) (poster) INTERSPEECH2017 Travel Grant Award
Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "Training algorithm to deceive anti-spoofing verification for DNN-based speech synthesis," Proc. ICASSP, pp. 4900--4904, New Orleans, U.S.A., Mar. 2017. (speech sample) (slide) 2017 Spoken Language Processing Student Grant of ICASSP
Yoshiki Mitsui, Daichi Kitamura, Shinnosuke Takamichi, Nobutaka Ono, and Hiroshi Saruwatari, "Blind source separation based on independent low-rank matrix analysis with sparse regularization for time-series activity," Proc. ICASSP, pp. 21–25, New Orleans, U.S.A., Mar. 2017. Finalist for Student Paper Context of ICASSP, 11th IEEE SPS Japan Student Conference Paper Award
Kazuhiro Kobayashi, Shinnosuke Takamichi, Satoshi Nakamura and Tomoki Toda, "The NU-NAIST voice conversion system for the Voice Conversion Challenge 2016," Proc. INTERSPEECH, pp. 1667--1671, San Francisco, U.S.A., Sep. 2016. 1st place in speaker similarity, Grants from NEC C&C Foundation, Outstanding Paper Award for Young C&C Researchers
Shinnosuke Takamichi, Kazuhiro Kobayashi, Kou Tanaka, Tomoki Toda, and Satoshi Nakamura, "The NAIST Text-to-Speech System for the Blizzard Challenge 2015," Proc. Blizzard Challenge Workshop, Berlin, Germany, Sep. 2015. (slide) 1st place in the naturalness of synthetic speech in 3 languages
Yuri Nishigaki, Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakti Sakriani, and Satoshi Nakamura, "Prosody-Controllable HMM-Based Speech Synthesis Using Speech Input," Proc. 2015 First Workshop on MLSLP, Aizu, Japan, Sep. 2015. (slide)
Quoc Truong Do, Sakriani Sakti, Shinnosuke Takamichi, Graham Neubig, Tomoki Toda, and Satoshi Nakamura, "Preserving Word-level Emphasis in Speech-to-speech Translation using Linear Regression HSMMs," Proc. INTERSPEECH, pp. 3665--3669, Dresden, Germany, Sep. 2015. Grants from International Speech Communication Association (ISCA)
Yuji Oshima, Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, "Non-native Speech Synthesis Preserving Speaker Individuality Based on Partial Correction of Prosodic and Phonetic Characteristics," Proc. INTERSPEECH, pp. 299--303, Dresden, Germany, Sep. 2015. (poster)
Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, and Satoshi Nakamura, "Modulation Spectrum-Constrained Trajectory Training Algorithm for HMM-Based Speech Synthesis," Proc. INTERSPEECH, pp. 1206--1210, Dresden, Germany, Sep. 2015.
Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, and Satoshi Nakamura, "Parameter generation algorithm considering modulation spectrum for HMM-based speech synthesis," Proc. ICASSP, pp. 4210--4214, Brisbane, Australia, Apr. 2015.
Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, and Satoshi Nakamura, "Modulation Spectrum-Constrained Trajectory Training for GMM-Based Voice Conversion," Proc. ICASSP, pp. 4859--4863, Australia, Apr. 2015.
Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, and Satoshi Nakamura, "Modulation Spectrum-based Post-filter for GMM-based Voice Conversion," Proc. APSIPA, Siem Reap, Cambodia, Dec. 2014. (poster) APSIPA ASC 2014 Best Paper Award
Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, and Satoshi Nakamura, "Modified Modulation Spectrum-based Post-filter for HMM-based Speech Synthesis," Proc. GlobalSIP, pp. 710--714, Atlanta, U.S.A., Dec. 2014. Implemented in HTS 2.3beta
Nozomi Jinbo, Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, "A Hearing Impairment Simulation Method Using Audiogram-based Approximation of Auditory Characteristics," Proc. INTERSPEECH, pp. 490--494, MAX Atria, Singapore, Sep. 2014.(poster)
Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, "A Postfilter to Modify The Modulation Spectrum in HMM-based Speech Synthesis," Proc. ICASSP, pp. 290--294, Florence, Italy, Apr. 2014. The 8th IEEE SPS Japan Outstanding Student Paper Award, Grants from NEC C&C Foundation
Takatomo Kano, Shinnosuke Takamichi, Sakriani Sakti, Graham Neubig, Tomoki Toda, and Satoshi Nakamura, "Generalizing Continuous-space Translation of Paralinguistic Information," Proc. INTERSPEECH, pp. 2614--2618, Lyon, France, Sep. 2013.
Shinnosuke Takamichi, Tomoki Toda, Yoshinori Shiga, Graham Neubig, Sakriani Sakti, and Satoshi Nakamura, "Improvements to HMM-based Speech Synthesis Based on Parameter Generation with Rich Context Models," Proc. INTERSPEECH, pp. 364--368, Lyon France, Sep. 2013.
Takatomo Kano, Sakriani Sakti, Shinnosuke Takamichi, Graham Neubig, Tomoki Toda, and Satoshi Nakamura, "A Method For Translation of Paralinguistic Information," Proc. IWSLT, pp. 158--163, 2012.
Shinnosuke Takamichi, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai, Sakriani Sakti, and Satoshi Nakamura, "An Evaluation of Parameter Generation Methods with Rich Context Models in HMM-Based Speech Synthesis," Proc. INTERSPEECH, Portland, U.S.A., Sep. 2012.

Google Sites

Report abuse