日本音響学会 第39回粟屋潔学術奨励賞, 2015.
Yamato Ohtani, ``Techniques for Improving Voice Conversion Based on Eigenvoices,'' Ph.D. thesis,Nara Institute of Science and Technology, March 2010.
大谷大和, ``固有声と混合励振源に基づく高品質な一対多声質変換,'' 修士論文, 奈良先端科学技術大学院大学, March 2007.
大谷大和, ``パラレル構成型適応ノッチフィルタのDSP実現 , '' 卒業論文, 大阪大学, March, 2005.
Tadashi Ogura, Takuma Okamoto, Yamato Ohtani, Erica Cooper, Tomoki Toda and Hisashi Kawai, "Phoneme-Level Duration Controllable Neural Text-to-Speech With Phoneme Embedding Skip Connection and Modified Gaussian Duration Modeling," in IEEE Access, vol. 13, pp. 118369-118380, 2025.
Yamato Ohtani, Takuma Okamoto, Tomoki Toda and Hisashi Kawai, "Fast Neural Vocoder with Fundamental Frequency Control Using Finite Impulse Response Filters," in IEEE Transactions on Audio, Speech and Language Processing, vol. 33, pp. 1893-1906, 2025.
Haruki Yamashita, Takuma Okamoto, Ryoichi Takashima, Yamato Ohtani, Tetsuya Takiguchi, Tomoki Toda, Hisashi Kawai, ``Fast Neural Speech Waveform Generative Models With Fully-Connected Layer-Based Upsampling,'' in IEEE Access, vol. 12, pp. 31409-31421, 2024
Yi-Chiao Wu, Patrick Lumban Tobing, Kazuki Yasuhara, Noriyuki Matsunaga, Yamato Ohtani, Tomoki Toda, ``A cyclical approach to synthetic and natural speech mismatch refinement of neural post-filter for low-cost text-to-speech system'',' APSIPA Transactions on Signal and Information Processing, Vol. 11, No. 1, e30, pp. 1-32, Sep. 2022.
Noriyuki MATSUNAGA, Yamato OHTANI, Tatsuya HIRAHARA , ``Loss Function Considering Multiple Attributes of a Temporal Sequence for Feed-Forward Neural Networks,'' IEICE Trans. Information and Sytems, Vol.E103-D No.12 pp.2659-2672, 2020.
松永悟行, 大谷大和, 平原達也, ``深層学習を用いた日本語音声合成における基本周波数に適した言語特徴量の正規化手法,'' 電子情報通信学会論文誌, Vol.J102-D, No.10, pp.721-729, 2019.
Yamato Ohtani, Masatsune Tamura, Masahiro Morita and Masami Akamine, ``Statistical bandwidth extension based on Gaussian mixture model with sub-band basis spectrum model,`` IEICE Trans. Information and Systems, vol.E99-D, no.10, pp. 2481-2489, October 2016 .
Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari and Kiyohiro Shikano, ``Improvements of the one-to-many eigenvoice conversion system,'' IEICE Trans. Information and Systems, vol.E93-D, no.9, pp.2491-2499, September 2010.
Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari and Kiyohiro Shikano, ``Adaptive training for voice conversion based on eigenvoices,'' IEICE Trans. Information and Systems, vol.E93-D, no.6, pp.1589-1598, June 2010.
川本真一, 足立吉広, 大谷大和, 四倉達夫, 森島繁生, 中村哲, ``来場者の声の特徴を反映する映像エンタテインメントシステムのための台詞音声生成システム,'' 情報処理学会論文誌, vol.51, No.2, pp.1234-1248, February, 2010.
大谷大和, 戸田 智基, 猿渡 洋, 鹿野 清宏, ``STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法,'' 電子情報通信学会論文誌,Vol. J91-D, No. 4, pp. 1082-1091, Apr. 2008.
”日本語音声合成エンジンAITalkⓇの仕組みとその活用 ,” 電気計算2021年5月号
"企業における研究者の役割とキャリア形成の心得", 日本音響学会学会誌,2020 年 77 巻 1 号, p. 46-47
日本音響学会編, ``音響キーワードブック,'' コロナ社 2016年(一部執筆)
Tadashi Ogura, Takuma Okamoto, Yamato Ohtani, Erica Cooper, Tomoki Toda, Hisashi Kawai, "GST-BERT-TTS: Prosody prediction without accentual labels for multi-speaker TTS using BERT with global style tokens," Proc. Interspeech 2025, pp. 444–448, August 2025.
Tadashi Ogura, Takuma Okamoto, Yamato Ohtani, Erica Cooper, Tomoki Toda and Hisashi Kawai, "Mora-Level Prosody Prediction for Text-to-Speech Using Japanese BERT Without Accentual Labels," Proc. ICASSP 2025, pp. 1-5, April 2025.
Takuma Okamoto, Yamato Ohtani, Sota Shimizu, Tomoki Toda, Hisashi Kawai, "Challenge of Singing Voice Synthesis Using Only Text-To-Speech Corpus With FIRNet Source-Filter Neural Vocoder," Proc. Interspeech 2024, pp. 1870-1874, September 2024.
Takuma Okamoto, Yamato Ohtani and Hisashi Kawai, "Mobile PresenTra: NICT fast neural text-to-speech system on smartphones with incremental inference of MS-FC-HiFi-GAN for low-latency synthesis," Proc. Interspeech 2024, pp. 997-998, 2024.
Takuma Okamoto, Yamato Ohtani, Tomoki Toda and Hisashi Kawai, "ConvNeXt-TTS and ConvNeXt-VC: ConvNeXt-based fast end-to-end sequence-to-sequence text-to-speech and voice conversion," Proc. ICASSP 2024, April 2024.
Yamato Ohtani, Takuma Okamoto, Tomoki Toda and Hisashi Kawai, "FIRNet: Fundamental frequency controllable fast neural vocoder with trainable finite impulse response filter," Proc. ICASSP 2024, pp. 10871-10875, April 2024.
Takuma Okamoto, Haruki Yamashita, Yamato Ohtani, Tomoki Toda and Hisashi Kawai, "WaveNeXt: ConvNeXt-based fast neural vocoder without iSTFT layer," Proc. ASRU 2023, December 2023.
Daisuke Yoshioka, Yusuke Yaduda, Noriyuki Matsunaga, Yamato Ohtani, Tomoki Toda, "Spoken-text-style transfer with conditional variational autoencoder and content word storage," Proc. Interspeech 2022, pp. 4576-4580, Incheon, Korea, September 2022.
Yi-Chiao Wu, Patrick Lumban Tobing, Noriyuki Matsunaga, Yamato Ohtani, Tomoki Toda, "A cyclical post-filtering approach to mismatch refinement of neural vocoder for text-to-speech systems," Interspeech 2020, pp. 3540-3544, October 2020.
Noriyuki Matsunaga, Yamato Ohtani, Tatsuya Hirahara, "Loss Function Considering Temporal Sequence for Feed-Forward Neural Network–Fundamental Frequency Case,`` Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 143-148, Semptember 2019.
Yamato Ohtani, Koichiro Mori and Masahiro Morita, "Voice quality control using perceptual expressions for statistical parametric speech synthesis based on cluster adaptive training,'' Proc. Interspeech2016, pp. 2258-2262, San Francisco, September 2016.
Yamato Ohtani, Yu Nasu, Masahiro Morita and Masami Akamine, "Emotional Transplant in Statistical Speech Synthesis Based on Emotion Additive Model,'' Proc. Interspeech2015, pp. 274-278, Dresden, September 2015.
Yamato Ohtani, Masatsune Tamura, Masahiro Morita and Masami Akamine, ``GMM-based bandwidth extension using sub-band basis spectrum model,'' Proc. Interspeech2014, pp. 2489-2493, Singapore, September 2014.
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima and Masami Akamine, ``HMM-based speech synthesis using sub-band basis spectrum model,'' Proc. Interspeech2012, pp. 1440-1443, Portland, September 2012.
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima and Masami Akamine, ``Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP,'' Proc. Interspeech2012, pp. 1155-1158, Portland, Sepetember 2012.
Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani and Masami Akamine, ``Continuous F0 in the source-excitation generation for HMM-based TTS: Do we need voiced/unvoiced classification?,'' Proc. of ICASSP201, pp. 4724--4727, May 2011.
Kumi Ohta, Tomoki Toda, Yamato Ohtani, Hiroshi Saruwatari, Kiyohiro Shikano, ``Adaptive voice-quality control based on one-to-many eigenvoice conversion,'' Proc. of INTERSPEECH, pp.2158-2161, Chiba, Japan, September 2010.
Chie Hayashida, Tomoki Toda, Yamato Ohtani, Hiroshi Saruwatari, Kiyohiro Shikano, ``Linear transformation approaches to many-to-one voice conversion,'' Proc. of the 7th ISCA Speech Synthesis Workshop (SSW7), pp.74-79, Kyoto, Japan, September 2010.
Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano, ``NON-PARALLEL TRAINING FOR MANY-TO-MANY EIGENVOICE CONVERSION,'' Proc. ICASSP 2010, pp. 4822--4825, Dallas, U.S.A., Mar. 2010.
Shin-ichi Kawamoto, Yoshihiro Adachi, Yamato Ohtani, Tatsuo Yotsukura, Shigeo Morishima, and Satoshi Nakamura, ``Scenario speech assignment technique for instant casting movie system,'' ACCV2009 Invited workshop on Vision Based Human Modeling and Synthesis, Xi'an, China, September 23-27, 2009.
Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano, ``Many-to-Many Eigenvoice Conversion with Reference Voice,'' INTERSPEECH, pp. 1623--1626, Brighton, UK, Sep. 2009.
Malorie Charlier, Yamato Ohtani, Tomoki Toda, Alexis Moinet, Thierry Dutoit, ``Cross-Language Voice Conversion Based on Eigenvoices,'' INTERSPEECH, pp. 1635-1638, Brighton, UK, Sep. 2009.
Yamato Ohtani, Tomoki Toda, Hiroshi. Saruwatari, Kiyohiro Shikano, ``An Improved One-to-Many Eigenvoice Conversion System,'' INTERSPEECH 2008, pp. 1080--1083, September 2008.
Takashi Muramatsu, Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano, ``Low-Delay Voice Conversion based on Maximum Likelihood Estimation of Spectral Parameter Trajectory,'' INTERSPEECH 2008, pp.1076--1079, September 2008.
Daisuke Tani, Tomoki Toda, Yamato Ohtani, Hiroshi Saruwatari, Kiyohiro Shikano, ``Maximum A Posteriori Adaptation for Many-to-One Eigenvoice Conversion,'' INTERSPEECH 2008, pp.1461--1464, September 2008.
Yamato Ohtani, Tomoki Toda, Hiroshi. Saruwatari, Kiyohiro Shikano, ``Speaker Adaptive Training for One-to-Many Eigenvoice Conversion Based on Gaussian Mixture Model,'' Proceedings of the 10th European Conference on Speech Communication and Technology (Interspeech 2007 - Eurospeech), pp. 1981--1984, August 2007.
Kumi Ohta, Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano, ``Regression Approaches to Voice Quality Control Based on One-to-Many Eigenvoice Conversion,'' 6th ISCA Speech Synthesis Workshop (SSW6), pp. 101-106, August 2007.
Daisuke Tani, Yamato Ohtani, Tomoki Toda, Hiroshi. Saruwatari, Kiyohiro Shikano, ``An Evaluation of Many-to-One Voice Conversion Algorithms with Pre-Stored Speaker Data Sets,'' 6th ISCA Speech Synthesis Workshop (SSW6), pp. 107-112, August 2007.
Tomoki Toda, Yamato Ohtani, Kiyohiro Shikano, ``One-to-Many and Many-to-One Voice Conversion Based on Eigenvoices,'' International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Vol. 4, pp. 1249-1252, April 2007.
Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari, and Kiyohiro Shikano, ``Evaluation of eigenvoice conversion based on Gaussian mixture model,'' ASA/ASJ Joint Meeting, November 2006.
Yamato Ohtani, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano, ``Maximum Likelihood Voice Conversion Based on GMM with STRAIGHT Mixed Excitation'', the 9th International Conference on Spoken Language Processing (Interspeech 2006 - ICSLP), pp. 2266--2269, September 2006.
Tomoki Toda, Yamato Ohtani, Kiyohiro Shikano, ``Eigenvoice Conversion Based on Gaussian Mixture Model,'' the 9th International Conference on Spoken Language Processing (Interspeech 2006 - ICSLP), pp. 2446--2449, September 2006.
山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒, ``重み付きAttentionのアライメント機構を用いた系列変換型声質変換'', 情報処理研報, Vol. 2025-SLP-143, No. 75, pp. 1-6, June 2025.
日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基, 河井恒, ``x-vectorを用いた多様な発話スタイルに対応する音声認識用コーパスを用いた複数話者テキスト音声合成の評価'',信学技報, vol. 123, no. 88, SP2023-25, pp. 125–130, June 2023 (音学シンポジウム2023).
山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒,``全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル'',信学技報, vol. 123, no. 88, SP2023-15, pp. 73–78, June 2023 (音学シンポジウム2023).
清水聡太,岡本拓磨,高島遼一,大谷大和,滝口哲也,戸田智基,河井恒,``MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較'',信学技報, vol. 123, no. 88, SP2023-5, pp. 20–25, June 2023 (音学シンポジウム2023).
大谷大和, 松永悟之, 平井啓之, ``深層ニューラルネットワークを用いた波形接続型感情音声合成のための感情制御法,'' 音学シンポジウム2019, 2019.
大谷大和, 森紘一郎, ``話者の声の特徴を直感的な言葉で制御できる音声合成技術,'' 東芝レビュー, Vol. 71 No. 4, pp. 80--83, June 2016.
浅見太一, 大谷大和, 小川哲司, 木下慶介, 倉田岳人, 齋藤大輔, 塩田さやか, 太刀岡勇気,中村静, 増村亮, 渡部晋治,``国際会議INTERSPEECH2015参加報告,'' 報処理学会研究報告, vol.2016-SLP-110, no. 4, February 2016
大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳, ``HMMに基づく感情音声合成のための共有感情付与モデル,'' 電子情報通信学会技術研究報告, Vol. 114 No. 303, pp. 13--18, November 2014. [link]
大谷大和, 田村正統, 森田眞弘, 赤嶺政已, ``サブバンド基底スペクトルモデルを利用した統計的帯域拡張法,'' 電子情報通信学会技術研究報告, Vol. 114, No. 52, pp. 303--308, May 2014. [link]
村松敬司, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化,'' 情報処理学会研究報告, 2008-SLP-75, pp. 33--38, February 2009. [link]
大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``参照話者を用いた多対多固有声声質変換法,'' 電子情報通信学会技術研究報告 Vol. 108, No. 422, SP2008-140, pp. 85--90, January 2009.
村松敬司, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``スペクトル系列の最尤推定に基づく短遅延声質変換法,'' 電子情報通信学会技術研究報告 Vol. 108, No. 422, SP2008-141, pp. 91--96, January 2009.
谷大輔, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``事前収録話者データを用いた多対一声質変換法,'' 電子情報通信学会技術研究報告, SP2007-81, vol. 107, no. 282, pp. 61--66, October 2007.
太田久美, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``一対多固有声変換に基づく声質制御法の評価,'' 電子情報通信学会技術研究報告, SP2007-82, vol. 107, no. 282, pp. 67--72, October 2007.
戸田智基, 大谷大和, 鹿野清宏, ``固有声に基づく声質変換法,'' 電子情報通信学会技術報告, SP2006-39, pp. 25--30, August 2006.
大谷大和,戸田智基,猿渡洋,鹿野清宏,``固有声に基づく声質変換のための話者正規化学習法'', 電子情報通信学会技術報告,SP2006-39,pp. 31--36,August 2006.
山下陽生,岡本拓磨,高島遼一,大谷大和,滝口哲也,戸田智基,河井恒, ``系列変換型声質変換モデルのモバイル端末実装,'' 日本音響学会講演論文集, 3-Q-21, pp.1365-1366, September, 2025.
周王子茜,岡本拓磨,大谷大和,サクティ サクリアニ,河井 恒, ``GANおよび拡散モデルに併用可能な高速ニューラルボコーダ,'' 日本音響学会講演論文集, 2-1-1, pp.1175-1176, September, 2025.
小椋忠志,岡本琢磨,大谷大和,Erica Cooper,戸田智基,河井恒, ``GST-BERT-TTS:アクセントラベル不要な複数話者日本語TTS,'' 日本音響学会講演論文集, 1-1-1, pp.1115-1118, September, 2025.
山下陽生,岡本拓磨,高島遼一,大谷大和,滝口哲也,戸田智基, 河井恒, ``系列変換型声質変換におけるアライメント方式の比較,'' 日本音響学会講演論文集, 3-P-20, pp. 1137-1140, March, 2025.
岡本拓磨,大谷大和,河井恒, ``Mobile PresenTra:スマートフォン上で高速動作可能なニューラルTTS,'' 日本音響学会講演論文集, 1-R-29, pp. 1069-1072, March, 2025.
小椋忠志,岡本拓磨,大谷大和,Erica Cooper, 戸田智基,河井恒, ``BERTを用いたアクセントラベル不要な日本語ニューラルTTS,'' 日本音響学会講演論文集, 1-2-5, pp. 893-896, March, 2025.
山下陽生,岡本拓磨,高島遼一,大谷大和,滝口哲也,戸田智基,河井恒,``系列変換型声質変換モデルにおける単調アライメント探索の改良'', 日本音響学会講演論文集, 2-6-1, September, 2024.
大谷大和, 岡本拓磨, 戸田智基, 河井恒, ``FIR型深層波形生成モデルを用いたF0制御可能なEnd-to-End音声合成の検討'', 日本音響学会講演論文集, 1-Q-40, September, 2024.
小椋 忠志, 大谷大和, 岡本拓磨, 戸田智基, 河井恒, ``音素埋め込みスキップ接続を用いた継続長拡張に頑健な音声合成'', 日本音響学会講演論文集, 1-6-3, September, 2024.
日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基, 河井恒, ``広帯域英語コーパス帯域拡張モデルによるCSJコーパスを用いた日本語複数話者テキスト音声合成の高品質化'', 日本音響学会2024年春季研究発表会講演論文集, 3-2-2, March, 2024.
岡本拓磨, 大谷大和, 戸田智基, 河井恒, ``ConvNeXt型超高速End-to-end音声合成・声質変換モデル'', 日本音響学会講演論文集, 2-P-20, March, 2024.
大谷大和, 岡本拓磨, 戸田智基, 河井恒, ``FIRNet: F0制御可能な有限インパルス応答に基づく高速ニューラルボコーダ'', 日本音響学会講演論文集, 1-Q-27, March, 2024.
山下陽生,岡本拓磨,高島遼一,大谷大和,滝口哲也,戸田智基,河井恒,``EdenVC:音素継続長とアライメントの協調学習を用いた系列長変換型声質変換モデル'', 日本音響学会講演論文集, 1-2-12, March, 2024.
清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒, ``正弦波入力型ニューラルボコーダを用いたTTSモデルによる歌声合成'', 日本音響学会講演論文集, 1-2-10, March 2024.
日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基, 河井恒, ``複数話者英語音声合成を用いたクロスリンガル音声合成の試み〜「日本語のあなたの声が英語ネイティブの発音へ」を目指して〜'', 日本音響学会関西支部第26回関西支部若手研究者交流研究発表会, December, 2023.
清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒, ``学習範囲外データに頑健なF0高調波入力型ニューラル波形生成モデルの検討〜様々な波形サンプルを合成可能なゼロショット合成〜'', 日本音響学会関西支部第26回関西支部若手研究者交流研究発表会, December, 2023.
山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒, ``End-to-End 系列変換型声質変換への高速ニューラル波形生成モデル導入の検討'', 日本音響学会講演論文集, pp. 1295–1298, September, 2023.
日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基, 河井恒, ``話者テキスト音声合成における話者ベクトルの安定化に関する検討'', 日本音響学会講演論文集, pp. 1137–1140, September, 2023.
清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒, ``F0予測・波形生成ネットワークの一貫学習によるメルスペクトログラム入力型F0制御可能ニューラルボコーダ'', 日本音響学会講演論文集, pp. 1041–1044, September, 2023.
吉岡 大貴, 安田 祐介, 松永 悟行, 大谷 大和, 戸田 智基, ``サイクル学習を用いた注意機構付きVAEによるテキスト発話スタイル変換,'' 日本音響学会講演論文集, 2-3Q-12, pp.911-912, March, 2023
吉岡 大貴, 安田 祐介, 松永 悟行, 大谷 大和, 戸田 智基, ``注意機構付きVAEを用いたテキスト発話スタイル変換の改良,'' 日本音響学会講演論文集, 1-8-16, pp.1583-1584, September, 2022
大谷大和, ``(招待講演)個人性を考慮したテキスト音声合成サービスとその展望,'' 日本音響学会講演論文集, 1-8-13, pp.1573-1574, September, 2022
吉岡 大貴, 安田 祐介, 松永 悟行, 大谷 大和, 戸田 智基, ``注意機構付きVAEを用いた日本語テキストの発話スタイル変換 ,'' 日本音響学会講演論文集, 2-3P-12, pp.1125-1126, March, 2022
安原 和輝, Wu Yi-Chiao, Lumban Tobing Patrick, 松永 悟行,大谷 大和, 戸田 智基, ``テキスト音声合成のためのポストフィルタ用 WaveNet ボコーダの学習条件に関する評価,'' 日本音響学会講演論文集, 2-2-11, pp.865-866, March, 2021
安原 和輝, Wu Yi-Chiao, Lumban Tobing Patrick, 松永 悟行, 大谷 大和, 戸田 智基, ``テキスト音声合成におけるポストフィルタとしてのWaveNetボコーダ学習法,'' 日本音響学会講演論文集, 1-2-5, pp.1051-1052, March, 2020
松永 悟行, 大谷 大和, 平原 達也, ``深層学習に基づく音声合成における2次統計量を用いたスペクトル特徴量のモデリングの検討,'' 日本音響学会講演論文集, 1-P-23, pp.1017-1020, September, 2019
松永 悟行, 大谷 大和, 平原 達也, ``深層学習に基づく日本語音声合成における基本周波数ための言語特徴量の正規化手法の検討,'' 日本音響学会講演論文集, 1-P-21, pp.1089-1090, March, 2019
森紘一郎, 大谷大和, 森田眞弘, ``声の印象表現語による話者生成,'' 日本音響学会講演論文集, 1-R-22, pp. 289--292, March 2016.
大谷大和, 森紘一郎, 森田眞弘, ``統計的音声合成におけるクラスタ適応学習を利用した知覚表現語による話者性制御法の検討,'' 日本音響学会講演論文集, 1-R-21, pp. 287--288, March 2016.
大谷大和, 那須悠, 森田眞弘, 赤嶺政已, ``平静音声から予測した感情付与モデルに基づく統計的感情音声合成,'' 日本音響学会講演論文集, 2-1-12, pp. 1329--1332, September 2015.
大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政已, ``HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討,'' 日本音響学会講演論文集, 2-7-2, pp. 233--236, September 2014.
大谷大和, 田村正統, 森田眞弘, 赤嶺政已, ``サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張,'' 日本音響学会講演論文集, 1-R5-8, pp. 395--396, March 2014.
大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政已, `` サブバンド基底スペクトルモデルを用いたHMM音声合成,'' 日本音響学会講演論文集, 3-P-22b, pp. 491--492, March 2013.
大谷大和, 田村正統, 森田眞弘, ``HMM音声合成におけるヒストグラムに基づくスペクトル強調法の検討,'' 日本音響学会講演論文集, 3-Q-1, pp. 349--450, September 2011.
林田 千瑛, 大谷大和, 戸田智基, 猿渡 洋, 鹿野清宏,``線形回帰に基づく多対一声質変換における各種モデル適応法の評価,'' 日本音響学会講演論文集, 1-7-18, pp. 319--320, March 2010.
大谷大和, 戸田智基, 猿渡 洋, 鹿野清宏, ``多対多固有声質変換のための非パラレルデータを用いた規範モデル学習,'' 日本音響学会講演論文集, 1-7-17, pp. 317--318, March 2010.
林田千瑛,大谷大和,戸田智基,猿渡洋,鹿野清宏,``最尤線形回帰に基づく多対一声質変換におけるモデル適応手法の検討'',音響学会関西支部第12回若手研究者交流研究発表会, page 9 December 2009.
大谷大和, 戸田智基, 猿渡 洋, 鹿野清宏, ``参照話者を用いた固有声に基づく多対多声質変換,'' 日本音響学会講演論文集, 2-2-1, pp. 285--286, September 2009.
林田千瑛, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``線形回帰に基づく多対一声質変換法の評価,'' 日本音響学会講演論文集, 1-2-13, pp. 261--262, September 2009.
村松敬司, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``共分散行列の対角化に基づく混合正規分布モデルを用いた声質変換処理の高速化,'' 日本音響学会講演論文集, 1-6-10, pp.309--310, March 2009.
村松敬司, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``最尤スペクトル系列変換のための短遅延処理アルゴリズム,'' 音響学会関西支部第11回若手研究者交流研究発表会, p.4, December 2008.
大谷大和,戸田智基,猿渡洋,鹿野清宏, ``固有声変換のための話者正規化学習における初期モデルの検討,'' 日本音響学会講演論文集, 2-P-23, pp.409--410, September 2008.
村松敬司,大谷大和,戸田智基,猿渡洋,鹿野清宏, ``最尤スペクトル系列変換に対する短遅延処理アルゴリズムの適用,'' 日本音響学会講演論文集, 3-4-9, pp.299--300, September 2008.
谷大輔,大谷大和,戸田智基,猿渡洋,鹿野清宏, ``適応データ量に頑健な多対一固有声変換法,'' 日本音響学会講演論文集, 3-Q-11, March 2008.
太田久美,大谷大和,戸田智基,猿渡洋,鹿野清宏, ``一対多固有声変換に基づく声質制御法の拡張,'' 日本音響学会講演論文集, 2-11-5, March 2008.
大谷大和,川本真一,戸田智基,中村哲,鹿野清宏, ``STRAIGHT モーフィングに基づく特定話者音声の生成,'' 日本音響学会講演論文集, 1-11-29, March 2008.
大谷大和, 戸田智基, 猿渡 洋, 鹿野清宏, ``固有声に基づく高品質一対多声質変換,'' 音響学会関西支部第10回若手研究者交流研究発表会, p.8, November 2007.
太田久美, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``一対多固有声変換に基づく声質制御法に関する予備的検討,'' 日本音響学会講演論文集, 1-4-13, pp.317--318, September 2007.
谷大輔, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``話者選択及び固有声に基づく多対一声質変換法とその評価,'' 日本音響学会講演論文集, 1-4-14, pp.319--320, September 2007.
大谷大和,戸田智基,猿渡洋,鹿野清宏, ``音源特徴量および発話内変動を考慮した固有声に基づく声質変換,'' 日本音響学会講演論文集, 1-8-12, pp.215--216, March 2007.
大谷大和, 戸田智基, 猿渡洋, 鹿野清宏, ``話者正規化学習法による固有声に基づく声質変換法の改善,'' 平成18年電気関係学会関西支部連合大会, G16-6, , November 2006.
大谷大和,戸田智基,猿渡洋,鹿野清宏,``固有声に基づく声質変換法における話者正規化学習法の導入'',音響学会講演論文集,1-6-14,pp. 181-182,September 2006.
戸田智基, 大谷大和, 鹿野清宏, ``固有声に基づく声質変換・制御法,'' 日本音響学会講演論文集, 1-6-13, pp.179--180, September 2006.
大谷大和,戸田智基,猿渡洋,鹿野清宏, ``混合正規分布モデルに基づく最尤話者変換法におけるSTRAIGHT による混合励振源の導入'', 日本音響学会講演論文集, 1-4-11, pp.233-234, March 2006.
``生成AIと業務への活用に向けて,'' NET-PE.JP全国大会, October, 2023.
``音声合成の研究開発から見る大手企業とベンチャー企業の違い,'' 人工知能エレクトロニクス卓越大学院プログラム第3回講演会, 東北大学, August, 2022.
``テキスト音声合成技術と国内における活用事例, '' 大阪大学基礎工学部招待講演, November, 2021.
``言葉を伝える人工知能技術:音声合成とその役割, '' NET-PE.JP全国大会, November, 2017.
岡本拓磨, 大谷大和, 戸田智基, 河井恒、``音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム,'' 国立研究開発法人情報通信研究機構, 特開2025-108262, 公知日: 2025.7.23
大谷大和, 岡本拓磨, 戸田智基, 河井恒、``音声波形生成システム、音声波形生成方法、および、音声波形予測プログラム,'' 国立研究開発法人情報通信研究機構, 特開2025-97122, 公知日: 2025.6.30
松永悟行, 大谷大和, ``音響モデル学習装置、方法およびプログラム、並びに、音声合成装置、方法およびプログラム,'' 株式会社エーアイ, 特許第7079455号, 登録日:2022.5.25, 公知日: 2022.6.2
大谷大和, 松永悟行, 平井啓之, 戸田智基, イーチャオ ウー, パトリック ルンバン トビン, ``音響特徴量変換モデル学習装置、方法およびプログラム、ニューラルボコーダ学習装置、方法およびプログラム、並びに、音声合成装置、方法およびプログラム,'' 株式会社エーアイ, 東海国立大学機構名古屋大学, 特願2019-194609, 公知日: 2021.4.30
松永悟行, 大谷大和, ``音響モデル学習装置、音声合成装置、方法およびプログラム,'' 株式会社エーアイ ,特許第6902759号, 登録日: 2021.6.24, 公知日: 2021.3.1
松永悟行, 大谷大和, ``言語処理装置、言語処理プログラムおよび言語処理方法,'' 株式会社エーアイ, 特許第6840124号, 登録日: 2021.2.18, 公知日: 2020.7.9
大谷大和, 松永悟行, 平井啓之, ``音声処理装置、音声処理プログラムおよび音声処理方法,'' 株式会社エーアイ, 特許第6864322号, 登録日: 2021.4.6, 公知日: 2020.1.23
森紘一郎, 平林剛, 森田眞弘, 大谷大和, ``音声合成辞書配信装置、音声合成配信システムおよびプログラム,'' 株式会社東芝, 株式会社東芝デジタルソリューションズ, 特許第7013172号, 登録日: 2022.1.21, 公知日: 2019.3.14
森紘一郎, 鈴木優, 大谷大和, 森田眞弘, ``話者検索装置、話者検索方法、および話者検索プログラム,'' 株式会社東芝, 株式会社東芝デジタルソリューションズ, 特許第6805037号, 登録日: 2020.12.7, 公知日: 2018.10.11
森田眞弘, 森紘一郎, 大谷大和, ``音声合成装置、音声合成方法およびプログラム ,'' 株式会社東芝, 株式会社東芝デジタルソリューションズ, 特開2018-155774, 公知日: 2018.10.4
大谷大和, 森紘一郎, ``学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム,'' 株式会社東芝, 特許第6523893号, 登録日: 2019.5.10, 公知日: 2017.3.23
森紘一郎, 大谷大和, ``音声合成装置、音声合成方法およびプログラム,'' 株式会社東芝, 特許第6483578号, 登録日: 2019.2.22, 公知日: 2017.3.23
大谷大和, 那須悠, 田村正統, 森田眞弘, ``音声処理装置、音声処理方法及びプログラム,'' 株式会社東芝, 特許第6271748号, 登録日: 2018.1.12, 公知日: 2016.3.24
橘健太郎, 田村正統, 大谷大和, ``音声合成辞書作成装置、音声合成装置、音声合成辞書作成方法及び音声合成辞書作成プログラム,'' 株式会社東芝, 特許第6392012号, 登録日: 2018.8.31, 公知日: 2016.2.4
大谷大和, 田村正統, 森田眞弘, ``音声処理装置、音声処理方法および音声処理方法により作成されたフィルタ,'' 株式会社東芝, 特開2015-212845, 公知日: 2015.11.26
大谷大和, 森田眞弘, ``音声処理装置、方法およびプログラム,'' 株式会社東芝, 特許第6157926号, 登録日: 2017.6.16, 公知日: 2014.12.8
大谷大和, 田村正統, 森田眞弘, ``音声合成装置、音声合成方法、音声合成プログラムならびに学習装置,'' 株式会社東芝, 特許第5631915号, 登録日: 2014.10.17 , 公知日: 2013.10.7
大谷大和, 田村正統, 森田眞弘, ``音声処理装置、音声処理方法および音声処理方法により作成されたフィルタ,'' 株式会社東芝, 特開2015-212845, 公知日: 2013.1.7
大谷大和, 中村哲, 川本真一, ``音声生成装置及びコンピュータプログラム,'' 株式会社国際電気通信基礎技術研究所, 特開2009-216724, 公知日: 2009.9.24
戸田智基, 大谷大和, 舛田剛志, ``声質変換モデル生成装置及び声質変換システム,'' 奈良先端科学技術大学院大学, 旭化成株式会社, 特許第4817250号, 登録日: 2011.9.9, 公知日: 2008.3.13