発表文献

発行年

All

2026

2025

2026

国内会議(査読なし)

Detection of Depression Using Web-Interview Data by LLM Enhanced with Multimodal Features
Isaac Morales Nolasco, Koichi Shinoda, Momoko Kitazawa, Yuriko Kaise, Shunsuke Takagi, Genichi Sugihara, and Taishiro Kishimoto
Technical Reports of IEICE PRMU, vol. 125, no. 348, pp. 49-54, January 22, 2026

2025

論文(査読あり)

Integrating Generative and Contrastive Approaches for Human Action Recognition
Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda
IEEE Access, vol. 13, pp. 100095 - 100104, 2025, https://doi.org/10.1109/ACCESS.2025.3575707

ContextualCoder: Adaptive In-context Prompting for Programmatic Visual Question Answering
Ruoyue Shen, Nakamasa Inoue, Dayan Guan, Rizhao Cai, Alex C. Kot, Koichi Shinoda
IEEE Transactions on Multimedia, Feb. 17 2025, https://doi.org/10.1109/TMM.2025.3543043

国際会議(査読あり)

Diffusion Pretraining for Gait Recognition in the Wild
Wei Ming Neo, Koichi Shinoda, Tat-Jen Cham
IEEE International Conference on Image Processing (ICIP) 2025, Sep. 14-17, 2025, Anchorage, USA, pp. 1295-1300, https://doi.org/10.1109/ICIP55913.2025.11084665

SepVAC: Multitask Learning of Speaker Separation, Speaker Localization, Microphone Array Localization, and Room Acoustic Parameter Estimation in Various Acoustic Conditions
Roland Hartanto, Sakriani Sakti, Koichi Shinoda
Proc. Interspeech 2025, Aug. 17-21, 2025, Rotterdam, Netherlands, pp. 2480-2484, https://doi.org/10.21437/Interspeech.2025-2784

Diffusion-based Generative Regularization for Supervised Discriminative Learning
Takuya Asakura, Nakamasa Inoue, Koichi Shinoda
Proceeding of IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), Feb. 28-Mar. 4, 2025, pp. 8915-8926, https://doi.org/10.1109/WACV61041.2025.00864

国際会議(査読なし)

Robust Gait Recognition in Unseen Environments through Diffusion-Model-Based Data Augmentation
Shinichi Ka, Koichi Shinoda
Ninth International Workshop on Symbolic-Neural Learning (SNL2025), Osaka, Japan, October 29-30, 2025

Regularizing Supervised Discriminative Learning with Diffusion Models
Takuya Asakura, Nakamasa Inoue, Koichi Shinoda
Ninth International Workshop on Symbolic-Neural Learning (SNL2025), Osaka, Japan, October 29-30, 2025

国内会議(査読なし)

マルチチャンネルモデルを用いた知識蒸留による単一チャンネル音声分離手法
二通大地, ローランドハルタント, 篠田浩一
ASJ Autumn Meeting, Sep 10-12, 2025

拡散モデルを用いたデータ拡張による未知環境に頑健な歩容認識
賈辰一, 篠田浩一
第 28 回画像の認識・理解シンポジウム (MIRU 2025), July 29 - August 1 2025

単一チャンネル音声分離のためのマルチチャンネルモデルを用いた知識蒸留手法
二通大地, ローランドハルタント, 篠田浩一
電子情報通信学会技術研究報告 SP, vol. 125, no. 74, pp. 10-15, 2025年6月

音韻レベルの話者情報を用いた音声認識における話者適応
伊藤光一, 篠田浩一
ASJ Spring Meeting, Mar 17-19, 2025

Multitask Training of Multi-channel Speaker Separation and Room Acoustic Parameter Estimation
Roland Hartanto, Sakriani Sakti, Koichi Shinoda
ASJ Spring Meeting, Mar 17-19, 2025

2024

論文(査読あり)

Feasibility of decoding covert speech in ECoG with a Transformer trained on overt speech
Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Toshihisa Tanaka
Scientific Reports, vol. 14, 11491, 2024, https://doi.org/10.1038/s41598-024-62230-9

Egocentric Human Activities Recognition With Multimodal Interaction Sensing
Yuzhe Hao, Asako Kanezaki, Ikuro Sato, Rei Kawakami, Koichi Shinoda
IEEE Sensors Journal, vol. 24, no. 5, pp. 7085-7096, Mar. 1, 2024, https://doi.org/10.1109/JSEN.2023.3349191

国際会議(査読あり)

LDMSE: Low Computational Cost Generative Diffusion Model for Speech Enhancement
Yuki Nishi, Koji Iwano, Koichi Shinoda
Proc. 2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Dec. 3-6, 2024, Macau, China, https://doi.org/10.1109/APSIPAASC63619.2025.10849051

Pyramid Coder: Hierarchical Code Generator for Compositional Visual Question Answering
Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda
IEEE International Conference on Image Processing (ICIP), Oct. 27-30, 2024, Abu Dhabi, United Arab Emirates, pp. 430-436, https://doi.org/10.1109/ICIP51287.2024.10648180

MSDET: Multitask Speaker Separation and Direction-of-Arrival Estimation Training
Roland Hartanto, Sakriani Sakti, Koichi Shinoda
Proc. Interspeech 2024, Sep. 1-5, 2024, Kos Island, Greece, pp. 2170-2174, https://doi.org/10.21437/Interspeech.2024-2537

Domain-Specific Adaptation for Enhanced Gait Recognition in Practical Scenarios
Nitish Jaiswal, Vi Duc Huan, Felix Limanta, Koichi Shinoda, Masahiro Wakasa
Proceedings of the 2024 6th International Conference on Image, Video and Signal Processing (IVSP '24), March 2024, pp 8-15, https://doi.org/10.1145/3655755.3655757

Co-speech Gesture Generation with Variational Auto Encoder
Shinichi Ka, Koichi Shinoda
Proc. International Conference on Multimedia Modeling, Amsterdam, The Netherlands, Jan. 29 - Feb. 2, 2024, https://doi.org/10.1007/978-3-031-53311-2_12

CAMOT: Camera Angle-Aware Multi-Object Tracking
Felix Limanta, Kuniaki Uto, Koichi Shinoda
Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), Jan. 4-8, 2024, pp. 6479-6488, https://doi.org/10.1109/wacv57701.2024.00635

国際会議(査読なし)

Multitask Learning Approach for Speaker Separation and Direction-of-Arrival Estimation
Roland Hartanto, Sakriani Sakti, Koichi Shinoda
Eighth International Workshop on Symbolic-Neural Learning (SNL2024), Tokyo, Japan, June 26-27, 2024

Utterance-based Method for Depression Detection in Video Interviews
Cheuk Hee Lam, Nathania Nah, Koichi Shinoda, Momoko Kitazawa, Yuriko Kaise, ShunsukeTakagi, Genichi Sugihara, and Taishiro Kishimoto
Eighth International Workshop on Symbolic-Neural Learning (SNL2024), Tokyo, Japan, June 26-27, 2024

Egocentric Human Activities Recognition with Multi-modal Interaction Sensing
Yuzhe Hao, Asako Kanezaki, Ikuro Sato, Rei Kawakami, Koichi Shinoda
Eighth International Workshop on Symbolic-Neural Learning (SNL2024), Tokyo, Japan, June 26-27, 2024

Hierarchical Code Generator for Compositional Visual Question Answering
Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda
Eighth International Workshop on Symbolic-Neural Learning (SNL2024), Tokyo, Japan, June 26-27, 2024

Camera Angle-Aware Multi-Object Tracking
Felix Limanta, Kuniaki Uto, Koichi Shinoda
Eighth International Workshop on Symbolic-Neural Learning (SNL2024), Tokyo, Japan, June 26-27, 2024

国内会議(査読なし)

Detection of Depression Using Web-Interview Data
Cheuk Hee Lam, Nathania Nah, Koichi Shinoda, Momoko Kitazawa, Yuriko Kaise, Shunsuke Takagi, Genichi Sugihara, Taishiro Kishimoto
Technical Reports of IEICE PRMU, vol. 124, no. 23, pp. 36-40, May 16, 2024

Multitask Learning of Speaker Separation and Direction-of-Arrival Estimation
Roland Hartanto, Sakriani Sakti, Koichi Shinoda
ASJ Spring Meeting, Mar. 6-8, 2024

音声強調のための拡散モデルにおける計算量の削減
西悠希，篠田浩一，岩野公司
ASJ Spring Meeting, Mar. 6-8, 2024

2023

国際会議(査読あり)

Multimodal Recognition of Speech and Electrocorticogram
Mitali Ahuja, Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, and Toshihisa Tanaka
Proc. 2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Taipei, Taiwan, Oct. 31 - Nov. 3, 2023. https://doi.org/10.1109/APSIPAASC58517.2023.10317527

Sensor Data Representation with Transformer-Based Contrastive Learning for Human Action Recognition and Detection
Lei Yang, Yuzhe Hao, Koichi Shinoda
Proc. EUSIPCO, Sept. 4-8, 2023. https://doi.org/10.23919/EUSIPCO58844.2023.10289883

Synthesizing Speech from ECoG with a Combination of Transformer-Based Encoder and Neural Vocoder
Kai Shigemi, Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Kohei Yatabe, Toshihisa Tanaka
Proc. 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), June 4-10, 2023, Rhodes Island, Greece. https://doi.org/10.1109/ICASSP49357.2023.10097004

EvIs-Kitchen: Egocentric Human Activities Recognition with Video and Inertial Sensor data
Yuzhe Hao, Kuniaki Uto, Asako Kanezaki, Ikuro Sato, Rei Kawakami, Koichi Shinoda
Proc. International Conference on MULTIMEDIA MODELING, Jan. 9 - 12, 2023, Bergen, Norway. https://doi.org/10.1007/978-3-031-27077-2_29

Text-Guided Object Detector for Multi-modal Video Question Answering
Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda
Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), Jan. 3-7, 2023, pp. 1032 - 1042. https://doi.org/10.1109/WACV56688.2023.00109

国際会議(査読なし)

Text-Guided Object Detector for Multi-modal Video Question Answering
Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda
Seventh International Workshop on Symbolic-Neural Learning (SNL2023), Tokyo, Japan, June 28-29, 2023

国内会議(査読なし)

拡散モデルを用いた音声強調の計算量削減
西悠希, 岩野公司, 篠田浩一
第25回音声言語および第10回自然言語処理シンポジウム, vol.123, pp.1-6(NLC), pp.1-6(SP), 2023年11月25日

変分自己符号化器を用いた発話時の動作生成の研究
賈辰一, 篠田浩一
電子情報通信学会パターン認識・メディア理解研究会 (PRMU), 2023年11月16日-17日

暗黙的なニューラル表現を用いた可変長な人間動作の生成
Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda
第22回情報科学技術フォーラム、FIT (Forum on Information Technology) 2023

A Multimodal Model for Personality Recognition through Speech
Nathania Nah, Takafumi Koshinaka, Koichi Shinoda, Yuri Tsuchiya
ASJ Autumn Meeting, Sep. 26-28, 2024

受容野の自動最適化によるモードに適応的なTransformerの開発
浅倉拓也, 井上中順 , 横田理央, 篠田浩一
2023年度人工知能学会全国大会（第37回），2023年6月6日-6月9日

天体画像における深層学習を用いたラインノイズ除去手法
江良真結子, 井上中順, 篠田浩一, 村田勝寛, 笹田真人, 庭野聖史, 谷津陽一, 河合誠之
日本天文学会2023年春季年会，2023年3月14日

天体画像における深層学習を用いたラインノイズ除去手法
江良真結子, 井上中順, 篠田浩一, 村田勝寛, 笹田真人, 細川稜平, 庭野聖史, 谷津陽一, 河合誠之
第13回光赤外線天文学大学間連携ワークショップ，2023年2月28日

畳み込みニューラルネットワークを用いたMITSuME望遠鏡画像からの突発天体検知
伊藤尚泰, 村田勝寛, 高橋一郎, 細川稜平, 笹田真人, 庭野聖史, 谷津陽一, 河合誠之, 篠田浩一, 井上中順, 伊藤亮介, 下川辺隆史
第13回光赤外線天文学大学間連携ワークショップ，2023年2月28日

Personality Recognition on Dyadic Interactions with Representation Learning
Nathania Nah, Takafumi Koshinaka, Koichi Shinoda
第9回音声・音響・信号処理ワークショップ（SPEASIP）IEICE Tech. Rep., vol. 122, no. 389, SP2022-81, pp. 241-246, Feb. 2023

専門書

音響学講座 7　音声(下)
岩野公司，河原達也，篠田浩一，伊藤彰則，増村亮，小川哲司，駒谷和範
コロナ社，Jan., 2023.

招待講演・チュートリアル

Structural MAP for LR & HMMs
Koichi Shinoda
Symposium for Celebrating 40 Years of Bayesian Learning in Speech and Language Processing and Beyond, IEEE ASRU 2023 Workshop Satellite Event, Taipei, December 20th, 2023.

2022

国際会議(査読あり)

Lattice-Based Data Augmentation for Code-Switching Speech Recognition
Roland Hartanto, Kuniaki Uto, Koichi Shinoda
Proc. 2022 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Chiang Mai, Thailand November 7-10, 2022, pp. 1667-1672. https://doi.org/10.23919/APSIPAASC55919.2022.9980277

Implicit Neural Representations for Variable Length Human Motion Generation
Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda
Proc. European Conference on Computer Vision (ECCV) 2022: 17th European Conference, Tel Aviv, Israel, October 23–27, 2022, Proceedings, Part XVII Oct 2022, Pages 356–372. https://doi.org/10.1007/978-3-031-19790-1_22

MSR-DARTS: Minimum Stable Rank of Differentiable Architecture Search
Kengo Machida, Kuniaki Uto, Koichi Shinoda, Taiji Suzuki
Proc. IJCNN2022, Jul. 2022. https://doi.org/10.1109/IJCNN55064.2022.9892751

Rotation-invariant detection and classification for wheat head detection
Takeru Ito, Kuniaki Uto, Koichi Shinoda
Proc. IGARSS2022, pp.5750-5753, Jul. 2022. https://doi.org/10.1109/IGARSS46834.2022.9883405

Transformer-Based Estimation of Spoken Sentences Using Electrocorticography
Shuji Komeiji, Kai Shigemi, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, and Toshihisa Tanaka
Proc. ICASSP2022, May 11, 2022. https://doi.org/10.1109/ICASSP43922.2022.9747443

国際会議(査読なし)

Tokyo Tech at TRECVID 2022: Multi-Stage Framework for Video Action Detection
Ronaldo Prata Amorim, Nakamasa Inoue, Koichi Shinoda
TRECVID Workshop 2022, Dec. 2022.

国内会議(査読なし)

MITSuME望遠鏡画像に対する深層学習を用いた突発天体検知システムの構築
伊藤尚泰, 村田勝寛, 細川稜平, 笹田真人, 庭野聖史, 谷津陽一, 河合誠之, 篠田浩一, 井上中順, 伊藤亮介, 下川辺隆史
日本天文学会2022年秋季年会講演予稿集, Sep 2022

Implicit Neural Representation Learning for Human Motion Generation
Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda
MIRU2022 ブックレット, Jul. 2022

滑らかな転移学習による汎化性能の改善
髙山啓太, 鈴木哲平, 佐藤育郎, 川上玲, 宇都有昭, 篠田浩一
MIRU2022 ブックレット, Jul. 2022

TransformerにおけるToken-Mixingの探索
浅倉拓也, 宇都有昭, 篠田浩一
第36回人工知能学会全国大会, Jun. 2022

ロバスト主成分分析に基づく劣化CCDカメラ画像のノイズ除去
江良真結子，井上中順，篠田浩一，細川稜平，村田勝寛，庭野聖史，谷津陽一，河合誠之
日本天文学会2022年春季年会，2022年3月4日

Incorporating Acoustic and Textual Information for Language Modeling in Code-switching Speech Recognition
Roland Hartanto, Kuniaki Uto, Koichi Shinoda
電子情報通信学会技術研究報告 SP, vol. 121, no. 385, pp. 56-63, 2022年3月1日

招待講演・チュートリアル

Deep Learning and High-Performance Computing
Koichi Shinoda
International Conference on Recent Progresses in Science, Engineering and Technology (ICRPSET 2022), December 26~27, 2022.

深層学習と高性能計算機科学
篠田浩一
電子情報通信学会Webinarテクノロジートレンドシリーズ, 2022年10月

フェロー記念講演： Co-Designに基づく深層学習基盤
篠田浩一
電子情報通信学会パターン認識・メディア理解研究会 (PRMU), 2022年3月10日

2021

論文(査読あり)

Paralinguistic Approach for Detecting Dementia Using Gated Convolutional Neural Network
Mariana RODRIGUES MAKIUCHI, Tifani WARNITA, Nakamasa INOUE, Koichi SHINODA, Michitaka YOSHIMURA, Momoko KITAZAWA, Kei FUNAKI, Yoko EGUCHI, Taishiro KISHIMOTO
IEICE TRANSACTIONS on Information and Systems, Vol. E104-D, No. 11, pp. 1930-1940, Nov 2021.

国際会議(査読あり)

Multimodal Emotion Recognition with High-Level Speech and Text Features
Mariana Rodrigues Makiuchi, Kuniaki Uto, Koichi Shinoda
Proc. IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2021, Dec 2021.

Smooth Transfer Learning for Source-to-Target Generalization
Keita Takayama, Ikuro Sato, Teppei Suzuki, Rei Kawakami, Kuniaki Uto, Koichi Shinoda
Proc. NeurIPS 2021 Workshop on Distribution Shifts: Connecting Methods and Applications, Dec 2021.

Noise-Tolerant Time-Domain Speech Separation with Noise Bases
Kohei Ozamoto, Kuniaki Uto, Koji Iwano, Koichi Shinoda
Proc. 13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Dec 2021.

国内会議(査読なし)

畳み込み行列の安定ランクを用いた深層学習モデル構造探索
町田兼梧, 宇都有昭, 篠田浩一, 鈴木大慈
第35回人工知能学会全国大会, Jun. 2021

複数擬人化エージェントの推薦によるオンラインイベントでの実証実験と利用者の行動分析
山下和也, 古田真理, 井上恵, 髙岡昂太, 篠田浩一, 本村陽一
第35回人工知能学会全国大会, Jun. 2021

敵対的学習とノイズ付加を用いた深層学習の頑健性の向上
中村歩, 宇都有昭, 篠田浩一
第27回画像センシングシンポジウム, Jun. 2021

部位の領域分割画像を入力とした微分可能レンダラによる人体の三次元再構成
櫻井凜太郎, 宇都有昭, 篠田浩一
信学技報, vol. 121, no. 23, pp. 31-36, May 2021

空撮画像による個葉スケール群落構造解析に向けて
宇都有昭, 篠田浩一
農業情報学会2021年度年次大会要旨集, pp. 25-26, May 2021

雑音の基底信号を用いた耐雑音性の高い時間領域音声分離
尾座本耕平, 岩野公司, 宇都有昭, 篠田浩一
信学技報, vol. 120, no. 399, pp. 63-67, Mar. 2021

頭蓋内脳波からのエンコーダ・デコーダモデルによる想像音声推定
林恒太朗, 古明地秀治, 三橋匠, 飯村康司, 鈴木皓晴, 菅野秀宣, 篠田浩一, 田中聡久
信学技報, pp. 164-169, Mar. 2021

招待講演・チュートリアル

巨大深層モデルの高速・省資源開発基盤とその応用
篠田浩一
情報処理学会連続セミナー2021 第9回「AIトレンド：大規模モデルと生成モデル」, Oct. 2021

2020

論文(査読あり)

The project for objective measures using computational psychiatry technology (PROMPT): Rationale, design, and methodology
Taishiro Kishimoto, Akihiro Takamiya, Kuo-ching Liang, Kei Funaki, Takanori Fujita, Momoko Kitazawa, Michitaka Yoshimura, Yuki Tazawa, Toshiro Horigome, Yoko Eguchi, Toshiaki Kikuchi, Masayuki Tomita, Shogyoku Bun, Junichi Murakami, Brian Sumali, Tifani Warnita, Aiko Kishi, Mizuki Yotsui, Hiroyoshi Toyoshiba, Yasue Mitsukura, Koichi Shinoda, Yasubumi Sakakibara, Masaru Mimura, on behalf of thePROMPT collaborators
Contemporary Clinical Trials Communications, 100649, Aug. 18, 2020

国際会議(査読あり)

NEC-TT Speaker Verification System for SRE'19 CTS Challenge
Kong Aik Lee, Koji Okabe, Hitoshi Yamamoto, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Keisuke Ishikawa, Koichi Shinoda,
Proc. Interspeech 2020, Oct. 2020

Estimation of leaf angle distribution based on statistical properties of leaf shading distribution
Kuniaki Uto, Mauro Dalla Mura, Yuka Sasaki, Koichi Shinoda
Proc. IGARSS2020, Oct. 2020

国際会議(査読なし)

Tokyo Tech at TRECVID 2020: Relation Modeling for Video Action Detection
Ronaldo Prata Amorim, Nakamasa Inoue, Koichi Shinoda
TRECVID 2020 Notebook Papers, Dec. 2020.

Team Takoyaki submission for VoxCeleb Speaker Recognition Challenge 2020
Keisuke Ishikawa, Kuniaki Uto, Koji Iwano, Koichi Shinoda
The VoxSRC Workshop 2020, Oct. 2020.

国内会議(査読なし)

変分自己符号化器との統合によるFew-Shot継続学習
髙山啓太, 宇都有昭, 篠田浩一
信学技報, vol. 120, no. 300, pp. 58-62, Dec. 2020

音声認識精度推定に基づく音素セット縮小
古明地秀治, 田中聡久, 篠田浩一
第35回　信号処理シンポジウム講演論文集, Nov. 2020

教師ありオートエンコーダによるFew-Shot継続学習
髙山啓太, 宇都有昭, 篠田浩一
第23回画像の認識・理解シンポジウム, Aug. 2020

正規化を用いた半畳み込み処理によるインスタンスセグメンテーション
伊藤武尊, 宇都有昭, 篠田浩一
第23回画像の認識・理解シンポジウム, Aug. 2020

解説・総説

論文誌10年の記録 2010年～2019年
篠田浩一, 瀧口吉郎, 小川一人, 佐野雅規, 内藤整, 藤井俊彰
映像情報メディア学会誌, Vol. 74, No. 5, pp. 813-817, Sep. 2020

招待講演・チュートリアル

マルチメディア認識の最新技術とビッグデータ解析
篠田浩一
東工大 InfoSyEnergy 研究/教育コンソーシアム第 2 回公開シンポジウム, Dec. 21, 2020.

Co-design of ML and HPC for video understanding
Koichi Shinoda
1st International Workshop on Deep Video Understanding (DVU 2020）, Oct. 25, 2020.

Fast and cost-effective deep learning algorithm platform for video processing in social infrastructure
Koichi Shinoda
Chinese Academy of Science (CAS), Jan. 14, 2020.

Fast and cost-effective deep learning algorithm platform for video processing in social infrastructure
Koichi Shinoda
2020 International Workshop on AI-Driven Social Innovation (IWAIDSI 2020), Beijing University of Posts and Telecommunications (BUPT), Jan. 13, 2020.

2019

論文(査読あり)

NEC-TT System for Mixed-Bandwidth and Multi-Domain Speaker Recognition
Kong Aik Lee, Hitoshi Yamamoto, Koji Okabe, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda
Computer speech & language, Volume 61, 101033, Nov. 13, 2019

Recurrent out-of-vocabulary word detection based on distribution of features
Taichi Asami, Ryo Masumura, Yushi Aono, Koichi Shinoda
Computer speech & language, Volume 58, Page 247-259, May 9, 2019.

国際会議(査読あり)

Multimodal Fusion of BERT-CNN and Gated CNN Representations for Depression Detection
Mariana Rodrigues Makiuchi, Tifani Warnita, Kuniaki Uto, Koichi Shinoda
Proc. AVEC2019, pp. 55-63, Oct. 2019

A Modified Algorithm for Multiple Input Spectrogram Inversion
Dongxiao Wang, Hirokazu Kameoka, Koichi Shinoda
Proc. INTERSPEECH2019, Sep. 2019

The NEC-TT 2018 Speaker Verification System
Kong Aik Lee, Hitoshi Yamamoto, Koji Okabe, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda
Proc. INTERSPEECH2019, Sep. 2019

Estimation of Diffuse Component of Global Radiation Based on Leaf-Scale Crop Images
Kuniaki Uto, Mauro Dalla Mura, Jocelyn Chanussot, Koichi Shinoda
Proc. IGARSS2019, pp. 6263--6266, Jul. 2019

Sequence-level knowledge distillation for model compression of attention-based sequence-to-sequence speech recognition
Raden Mu’az Mun’im, Nakamasa Inoue, Koichi Shinoda
Proc. ICASSP2019, pp. 6151-6155, May 2019

国際会議(査読なし)

Estimation of skylight conditions based on leaf-scale wheat images
Kuniaki Uto, Mauro Dalla Mura, Jocelyn Chanussot, Koichi Shinoda
Images et data : méthodes d'analyse et modélisation pour l'agriculture numérique, Mar. 14, 2019

国内会議(査読なし)

Speech-linguistic Multimodal Representation for Depression Severity Assessment
Mariana Rodrigues Makiuchi, Tifani Warnita, Kuniaki Uto, Koichi Shinoda
情報処理学会研究報告, Vol.2019-SLP-130 No.8, Dec. 2019.

KL統計量に基づくニューラルネットワークのプルーニング
町田兼梧, 井上中順, 篠田浩一
第22回画像の認識・理解シンポジウム, Jul. 2019

個葉スケール作物画像からの特徴抽出に関する検討
宇都有昭, ダラムラマウロ, シャヌソジョセリン, 篠田浩一
研究報告コンピュータビジョンとイメージメディア (CVIM), 　Vol. 2019-CVIM-217, No. 38, pp. 106, May 2019.

深層学習を用いた MITSuME 望遠鏡画像からの突発天体検知
飯田康太, 谷津陽一, 伊藤亮介, 村田勝寛, 橘優太朗, 河合誠之, Yan Long, 篠田浩一, 井上中順, 下川辺隆史
日本天文学会2019年春季年会, Mar. 2019

Improving the robustness of multiple input spectrogram inversion
Dongxiao Wang, Hirokazu Kameoka, Koichi Shinoda
日本音響学会2019年春季研究発表会講演論文集, pp. 1307-1308, Mar. 7, 2019

A robust algorithm of phase recovery for speech enhancement
Dongxiao Wang, Hirokazu Kameoka, Koichi Shinoda
電子情報通信学会技術研究報告 SP, vol. 118, no. 497, pp. 137-142, Mar. 14, 2019

SLP研究会の新たな試み：国際会議既セッション
山岸順一, 安田裕介, Yi Zhao, Tifani Warnita, Fuming Fang, Yilong Peng, 田中智弘, Bairong Zhuang, Yi-Chiao Wu, 須田仁志, Hieu-Thi Luong, Patrick Lumban Tobing, 高島悠樹
情報処理学会研究報告 SLP, Feb. 27, 2019

基調講演

深層学習と高性能計算
篠田浩一
xSIG2019, May 27, 2019

情報理工学の現状と将来
篠田浩一
第40回蔵前科学技術セミナー, Feb. 23, 2019

招待講演・チュートリアル

超大規模深層学習に向けて
篠田浩一
JST AIP ネットワークラボ　第４回JST-NSF-DATAIA 国際連携シンポジウム, Dec. 19, 2019.

映像処理のための高速かつ低コストな深層学習アルゴリズムの開発
篠田浩一
一般社団法人日本オプトメカトロニクス協会, 2019-1 デジタル・イメージング技術部会, Jul. 16, 2019.

2018

国際会議(査読あり)

Few-Shot Adaptation for Multimedia Semantic Indexing
Nakamasa Inoue, Koichi Shinoda
Proc. ACM Multimedia, pp. 1110-1118, Oct. 23, 2018

Attentive Statistics Pooling for Deep Speaker Embedding
Koji Okabe, Takafumi Koshinaka, Koichi Shinoda
Proc. Interspeech, pp. 2252--2256, Sep. 4, 2018

I-vector Transformation Using Conditional Generative Adversarial Networks for Short Utterance Speaker Verification
Jiacen Zhang, Nakamasa Inoue, Koichi Shinoda
Proc. Interspeech, pp. 3613-3617, Sep. 4, 2018

Detecting Alzheimer's Disease Using Gated Convolutional Neural Network from Audio Data
Tifani Warnita, Nakamasa Inoue, Koichi Shinoda
Proc. Interspeech, pp. 1706-1710, Sep. 4, 2018

A Fine-to-Coarse Convolutional Neural Network for 3D Human Action Recognition
Thao Minh Le, Nakamasa Inoue, Koichi Shinoda
Proc. British Machine Vision Conference (BMVC), Sep. 3, 2018

Deep Learning Based Multi-modal Addressee Recognition in Visual Scenes with Utterances
Thao Le Minh, Nobuyuki Shimizu, Takashi Miyazaki, Koichi Shinoda
Proc. International Joint Conference on Artificial Intelligence (IJCAI), pp. 1546-1553, Jul. 13, 2018

Multi-Task Autoencoder for Noise-Robust Speech Recognition
Haoyi Zhang, Conggui Liu, Nakamasa Inoue, Koichi Shinoda
Proc. ICASSP, pp. 5599-5603, Apr. 15, 2018

国際会議(査読なし)

The NEC-TT Speaker Verification System for SRE’18
K. A. Lee, H. Yamamoto, K. Okabe, Q. Wang, L. Guo, T. Koshinaka, J. Zhang, K. Shinoda.
Proc. NIST 2018 Speaker Recognition Evaluation, Dec. 2018

VANT at TRECVID 2018
Nakamasa Inoue, Chihiro Shiraishi, Aleksandr Drozd, Koichi Shinoda, Shi-wook Lee, Alex Chichung Kot
Proc. TRECVID workshop, Nov. 13, 2018

国内会議(査読なし)

Skeleton-based Human Action Recognition with Fine-to-Coarse Convolutional Neural Network
Thao Minh Le, Nakamasa Inoue, Koichi Shinoda
Technical Reports of IEICE PRMU, vol. 118, no. 362, pp. 61-64, Dec. 13, 2018

深層学習を用いたMITSuME望遠鏡画像からの突発天体検知
飯田康太, 谷津陽一, 伊藤亮介, 村田勝寛, 橘優太朗, 河合誠之, Yan Long, 篠田浩一, 井上中順, 下川辺隆史
第9回光赤外線天文学大学間連携ワークショップ, Dec., 2018

Generative Adversarial Network Based i-Vector Transformation for Short Utterance Speaker Verification
Jiacen Zhang, Nakamasa Inoue, Koichi Shinoda
ASJ 2018 Autumn Meeting, pp. 1345-1346, Aug. 29, 2018

Alzheimer's Disease Prediction Using Audio Gated Convolutional Neural Network
Tifani Warnita, Nakamasa Inoue, Koichi Shinoda
ASJ 2018 Autumn Meeting, pp. 1223-1224, Aug. 29, 2018

Astronomical Image Subtraction for Transient Detection Using CNN
Yan Long, Nakamasa Inoue, Koichi Shinoda, Yoichi Yatsu, Ryosuke Itoh, Nobuyuki Kawai
The 21st Meeting on Image Recognition and Understanding (MIRU), Aug. 7, 2018

単語分散表現を用いた動画からのイベント検出
金井怜, 井上中順, 李時旭, 篠田浩一
第21回画像の認識・理解シンポジウム (MIRU), Aug. 7, 2018

社会インフラ映像処理のための高速・省資源深層学習アルゴリズム基盤
篠田浩一
JST CREST「イノベーション創発に資する人工知能基盤技術の創出と統合化」研究領域成果展開シンポジウム「イノベーション創発を目指した研究開発」, Apr. 14, 2018

全層ゲート付き2次元畳み込みネットワークによる多重音信号の音高認識
生田目敬弘, 亀岡弘和, 篠田浩一
研究報告音声言語情報処理（SLP）, vol. 120, no. 12, pp. 1-7, Feb. 13, 2018

解説・総説

ICMR2018 国際会議開催側の視点も交えて
相澤清晴, 佐藤真一, 柳井啓司, 井出一郎, 山崎俊彦, 入江豪, 小川貴弘, 望月貴裕, 新田直子, 篠田浩一, 呉志鵬, 松井勇佑, 牛久祥孝, 内田祐介
映像情報メディア学会誌, Vol. 72, No. 6, Nov., 2018

招待講演・チュートリアル

深層学習のためのCo-Design
篠田浩一
電子情報通信学会技術研究報告 SP/PRMU, vol. 118, no. 112, pp. 65, Jun. 29, 2018

(チュートリアル) 画像・映像認識
井上中順
人工知能学会, Jun. 6, 2018

画像・映像認識とゼロショット学習
井上中順
SOFT九州支部夏季ワークショップ2018, Aug. 28, 2018

2017

論文(査読あり)

Cross-View Human Action Recognition from Depth Maps Using Spectral Graph Sequences
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda
Elsevier Journal of Computer Vision and Image Understanding (CVIU), vol. 154, pp. 108-126, Jan. 1, 2017

国際会議(査読あり)

A Unified Network for Multi-Speaker Speech Recognition with Multi-Channel Recordings
Conggui Liu, Nakamasa Inoue, Koichi Shinoda
Proc. APSIPA, pp. 1304-1307, Dec. 11, 2017

Multimodal Speech Recognition Using Mouth Images from Depth Camera
Yuki Yasui, Nakamasa Inoue, Koji Iwano, Koichi Shinoda
Proc. APSIPA, pp. 1233-1236, Dec. 11, 2017

User Adaptation of Convolutional Neural Network for Human Activity Recognition
Shinya Matsui, Nakamasa Inoue, Yuko Akagi, Goshu Nagino, Koichi Shinoda
2017 25th European Signal Processing Conference (EUSIPCO), pp. 753-757, Oct. 26, 2017

CTC Network with Statistical Language Modeling for Action Sequence Recognition in Videos
Mengxi Lin, Nakamasa Inoue, Koichi Shinoda
Proc. ACM Multimedia Thematic Workshop, pp. 393-401, Oct. 23, 2017

Boredom Recognition based on Users' Spontaneous Behaviors in Multiparty Human-Robot Interactions
Yasuhiro Shibasaki, Kotaro Funakoshi, Koichi Shinoda
Proc. MultiMedia Modeling (MMM), pp. 677-689, Jan. 4, 2017

国際会議(査読なし)

TokyoTech-AIST at TRECVID 2017: Multimedia Event Detection Using Deep CNNs and Zero-Shot Classifiers
Nakamasa Inoue, Ryosuke Yamamoto, Na Rong, Satoshi Kanai, Junsuke Masada, Chihiro Shiraishi, Shi-wook Lee, Koichi Shinoda
Proc. TRECVID workshop, pp. 1-6, Nov. 13, 2017

Development of a cloud detection system utilizing image recognition technology
Y. Yatsu, T. Yoshii, N. Kawai, J. Sakuma, N. Inoue, K. Shinoda, T. Shimokawabe
V WORKSHOP ON ROBOTIC AUTONOMOUS OBSERVATORIES, Oct., 2017

国内会議(査読なし)

Action Sequence Recognition in Videos by Combining a CTC Network with a Statistical Language Model
Mengxi Lin, Nakamasa Inoue, Koichi Shinoda
Technical Reports of IEICE PRMU, vol. 117, no. 362, pp. 1-6, Dec. 16, 2017

口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識
安井勇樹, 岩野公司, 井上中順, 篠田浩一
日本音響学会2017年秋季研究発表会講演論文集, pp. 117-118, Sep. 25, 2017

Joint training of speaker separation and speech recognit ion based on deep learning
Conggui Liu, Nakamasa Inoue, Koichi Shinoda
ASJ 2017 Autumn Meeting, pp. 63-64, Sep. 25, 2017

口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識
安井勇樹, 岩野公司, 井上中順, 篠田浩一
情報処理学会研究報告 SLP, Jul. 27, 2017

Deep Learningを応用した全天画像からの気象識別
谷津陽一, 白石一輝, 吉井健敏, 河合誠之, 佐久間淳一, 井上中順, 篠田浩一, 下川辺隆史
天文学におけるデータ科学的方法, May, 2017

畳み込みニューラルネットワークを用いた夜間全天画像からの雲領域検出
佐久間惇一, 篠田浩一, 井上中順, 谷津陽一, 吉井健敏, 河合誠之, 下川辺隆史
情報処理学会第79回全国大会論文集, pp. 283-284, Mar. 16, 2017

話者認識と顔画像認識を用いた映像におけるマルチモーダル人物同定
西史人, 井上中順, 岩野公司, 篠田浩一
日本音響学会2017年春季研究発表会講演論文集, pp. 129-130, Mar. 15, 2017

Speaker Separation in Multi-Channel Environment Using Deep Learning
Conggui Liu, Nakamasa Inoue, Koichi Shinoda
Technical Reports of IPSJ SLP, vol. 115, no. 11, pp. 1-6, Feb. 18, 2017

教科書

「音声認識」(機械学習プロフェッショナルシリーズ)
篠田浩一
講談社, Dec. 7, 2017

招待講演・チュートリアル

高速かつ省資源な深層学習の実現に向けて
篠田浩一
JST・NSF国際連携シンポジウム, Dec. 20, 2017

深層学習の音声認識への応用
篠田浩一
情報処理学会連続セミナー2017 第4回ディープラーニングの活用と基盤, Oct. 17, 2017

Video Information Retrieval
Koichi Shinoda
The 2017 IEEE SPS Summer School on Visual Image Search and Visual Analytics (VISVA2017), Jul. 5, 2017

2016

論文(査読あり)

Experiments with Optical Properties of Skin on Fingers
Martin Drahansky, Ondrej Kanich, Eva Brezinova, Koichi Shinoda
International Journal of Optics and Applications, vol. 6, no. 2, pp. 37-46, Oct. 1, 2016

Semantic Indexing for Large-Scale Video Retrieval
Nakamasa Inoue, Koichi Shinoda
ITE Transactions on Media Technology and Applications, vol. 4, no. 3, pp. 209-217, Jul. 1, 2016

Wise Teachers Train Better DNN Acoustic Models
Ryan Price, Kenichi Iso, Koichi Shinoda
EURASIP Journal on Audio Speech and Music Processing, 10, pp. 1-19, Apr. 12, 2016

国際会議(査読あり)

Graph Regularized Implicit Pose for 3D Human Action Recognition
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda
Proc. APSIPA, pp. 155-159, Dec. 12, 2016

The NEC-TT Speaker Recognition System for NIST SRE16
Hitoshi Yamamoto, Koichi Shinoda
Proc. NIST SRE workshop, Dec. 11, 2016

Adaptation of Word Vectors using Tree Structure for Visual Semantics
Nakamasa Inoue, Koichi Shinoda
Proc. ACM Multimedia, pp. 277-281, Oct. 15, 2016

Recurrent Out-of-Vocabulary Word Detection Using Distribution of Features
Taichi Asami, Ryo Masumura, Yushi Aono, Koichi Shinoda
Proc. Interspeech, pp. 1320-1324, Sep. 10, 2016

国際会議(査読なし)

TokyoTech at TRECVID 2016
Nakamasa Inoue, Ryosuke Yamamoto, Na Rong, Koichi Shinoda
Proc. TRECVID workshop, pp. 1-6, Nov. 14, 2016

国内会議(査読なし)

突発天体観測用天文台全球リレーのための気象モニターの開発
谷津陽一, 吉井健敏, 針田聖平, 村木雄太郎, 河合誠之, 佐久間惇一, HyunJin Jung, 井上中順, 篠田浩一, 下川辺隆史, 太田佳
天文学会予稿集, p. 210, Sep. 14, 2016

複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善
岩野公司, 荒毛祐紀, 小平優希, 篠田浩一
電子情報通信学会技術研究報告 SP, vol. 116, no. 189, pp. 53-58, Aug. 25, 2016

Concept Elimination for Zero-Shot Event Detection
Tran Hai Dang, Nakamasa Inoue, Koichi Shinoda
The 22nd Symposium on Sensing via Image Information (SSII), IS2-19, Jun. 9, 2016

楽器と音高の同時認識のためのRNN音響モデル
生田目敬弘, 亀岡弘和, 篠田浩一
第111回音楽情報科学研究会音学シンポジウム, vol. 111, no. 46, pp. 1-5, May 21, 2016

多人数環境下でのロボットとの対話における人間の退屈状態の推定
芝崎泰弘, 船越孝太郎, 篠田浩一
電子情報通信学会技術研究報告 PRMU, vol. 115, no. 517, pp. 119-124, Mar. 24, 2016

複数スマートフォンで収録された会話音声の相互スペクトル減算を用いた話者決定
小平優希, 篠田浩一, 岩野公司
情報処理学会第78回全国大会講演論文集, pp. 533-534, Mar. 12, 2016

解説・総説

音声言語処理における深層学習：総説
篠田浩一
日本音響学会誌, vol. 73, no. 1, pp. 25-30, Dec. 25, 2016

招待講演・チュートリアル

Video Semantic Indexing and Localization
Koichi Shinoda
5th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan, vol. 140, no. 4, p. 3009, Nov. 28, 2016

東工大TSUBAMEの活用事例：マルチメディア認識のための深層学習
篠田浩一
GTC Japan 2016, Oct. 5, 2016

Deep Learning for Speech, Image, and Video
Koichi Shinoda
International Conference on Computer, Control, Informatics, and Its Applications (IC3INA), Oct. 3, 2016

(チュートリアル) 音声・画像・映像処理における深層学習
篠田浩一, 井上中順
言語処理学会第22回年次大会(NLP2016) 講演論文集, Mar. 7, 2016

2015

論文(査読あり)

Error Correction Using Long Context Match for Smartphone Speech Recognition
Yuan Liang, Koji Iwano, Koichi Shinoda
IEICE Transactions on Information and Systems, vol. E98-D, no. 11, pp. 1932-1942, Nov. 1, 2015

Fast Coding of Feature Vectors using Neighbor-To-Neighbor Search
Nakamasa Inoue, Koichi Shinoda
IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), vol. 38, no. 6, pp. 1170-1184, Sep. 23, 2015

Robust Discriminative Training Against Data Insufficiency in PLDA-Based Speaker Verification
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda
Elsevier Computer Speech and Language, vol. 35, pp. 32-57, Jun. 20, 2015

Autonomous Selection of i-Vectors for PLDA Modelling in Speaker Verification
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda
Elsevier Speech Communication, vol. 72, pp. 32-46, May 8, 2015

国際会議(査読あり)

Vocabulary Expansion Using Word Vectors for Video Semantic Indexing
Nakamasa Inoue, Koichi Shinoda
Proc. ACM Multimedia, pp. 851-854, Oct. 26, 2015

New Materials for Spoofing Touch-based Fingerprint Scanners
Jan Spurny, Michal Dolezel, Ondrej Kanich, Martin Drahansky, Koichi Shinoda
Proc. International Conference on Computer Application Technologies, pp. 207-211, Sep. 1, 2015

Speaker Diarization Using Multi-Modal i-vectors
Fumito Nishi, Nakamasa Inoue, Koichi Shinoda
Proc. International Technical Conference on Circuits/Systems Computers and Communications (ITC-CSCC), pp. 27-30, Jun. 29, 2015

国際会議(査読なし)

TokyoTech at TRECVID 2015
Nakamasa Inoue, Tran Hai Dang, Ryosuke Yamamoto, Koichi Shinoda
Proc. TRECVID workshop, pp. 1-10, Nov. 16, 2015

Combining Audio Features and Visual i-vector at MediaEval 2015 Multimodal Person Discovery in Broadcast TV
Fumito Nishi, Nakamasa Inoue, Koichi Shinoda
Proc. MediaEval Workshop, Sep. 14, 2015

国内会議(査読なし)

単語ベクトルによる語彙拡張を用いた映像のセマンティックインデクシング
井上中順, 篠田浩一
電子情報通信学会技術研究報告 PRMU, vol. 115, no. 388, pp. 75-80, Dec. 21, 2015

活性化関数のパラメータ制御を用いた LSTM による音声認識
松山祐輔, Ryan Price, 篠田浩一
日本音響学会2015年秋季研究発表会講演論文集, pp. 1-2, Sep. 16, 2015

音声・動画像の因子分析を用いる話者ダイアライゼーション
西史人, 井上中順, 篠田浩一
日本音響学会2015年秋季研究発表会講演論文集, pp. 175-176, Sep. 16, 2015

A DNN-Based ASR System for the Indonesian Language
Devin Hoesen, Ryan Price, Puji Lestari Dessi, Koichi Shinoda
Proc. ASJ 2015 Autumn Meeting, pp. 5-6, Sep. 16, 2015

ロボットとの対話における人間の「退屈」状態の解析
芝崎泰弘, 船越孝太郎, 篠田浩一
第14回情報科学技術フォーラム講演論文集 (FIT), vol. 14, no. 3, pp. 163-166, Aug. 24, 2015

マルチモーダルi-vectorを用いた話者ダイアライゼーション
西史人, 井上中順, 篠田浩一
情報処理学会研究報告 SLP, vol. 107, no. 4, pp. 1-6, Jul. 17, 2015

CNNから抽出した複数特徴量の統合に基づいた映像の意味インデクシング
福田竣, 井上中順, 篠田浩一
第21回画像センシングシンポジウム (SSII) 講演論文集, IS2-16, Jun. 11, 2015

Human Action Retrieval Based on Temporal Matching
Mengxi Lin, Nakamasa Inoue, Koichi Shinoda
Technical Reports of IEICE PRMU, vol. 114, no. 454, pp. 125-130, Feb. 20, 2015

Spectral Graph Wavelets for Skeleton-based 3D Action Recognition
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda
Technical Reports of IEICE PRMU, vol. 114, no. 454, pp. 131-136, Feb. 19, 2015

招待講演・チュートリアル

音声・画像・映像におけるDeep Learningを用いたパターン認識
篠田浩一
人工知能学会AIチャレンジ研究会予稿集, pp. 1-6, Nov. 12, 2015

音声認識のためのDeep Learning 企画シンポジウムディープラーニングの切り口：神経回路学会の視点から
篠田浩一
第25回日本神経回路学会全国大会, Sep. 4, 2015

Robust Video Information Retrieval using Speech Technologies
Koichi Shinoda
Korea University, Jun. 30, 2015

統計的パターン認識のための中間表現
篠田浩一
電子情報通信学会技術研究報告 SP, vol. 114, no. 474, pp. 73, Mar. 2, 2015

A New Speech Recognition Paradigm Based on Deep Learning
Koichi Shinoda
University of Science, VNU-HCM, Jan. 15, 2015

Robust video information retrieval using speech technologies
Koichi Shinoda
University of Information Technology, VNU-HCM, Jan. 14, 2015

2014

国際会議(査読あり)

Speaker Adaptation of Deep Neural Networks Using a Hierarchy of Output Layers
Ryan Price, Kenichi Iso, Koichi Shinoda
Proc. Spoken Language Technology (SLT) Workshop, pp. 153-158, Dec. 7, 2014

An Efficient Error Correction Interface for Speech Recognition on Mobile Touchscreen Devices
Yuan Liang, Koji Iwano, Koichi Shinoda
Proc. Spoken Language Technology (SLT) Workshop, pp. 454-459, Dec. 7, 2014

n-Gram Models for Video Semantic Indexing
Nakamasa Inoue, Koichi Shinoda
Proc. ACM Multimedia (MM), pp. 777-780, Nov. 3, 2014

Spectral Graph Skeletons for 3D Action Recognition
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda
Proc. Asian Conference on Computer Vision (ACCV), pp. 1-16, Nov. 1, 2014

Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition
Yuan Liang, Koji Iwano, Koichi Shinoda
Proc. Interspeech, pp. 1194-1198, Sep. 16, 2014

Discriminative PLDA training with application-specific loss functions for speaker verification
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda
Proc. Odyssey Workshop, pp. 26-32, Jun. 16, 2014

i-Vector Selection for Effective PLDA Modeling in Speaker Recognition
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda
Proc. Odyssey Workshop, pp. 100-105, Jun. 16, 2014

Constrained Discriminative PLDA Training for Speaker Verification
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda
Proc. International Conference on Acoustic Speech and Signal Processing (ICASSP), pp. 1689-1693, May 4, 2014

Event Detection by Velocity Pyramid
Zhuolin Liang, Nakamasa Inoue, Koichi Shinoda
Proc. Multimedia Modeling (MMM), pp. 353-364, Jan. 6, 2014

国際会議(査読なし)

TokyoTech-Waseda at TRECVID 2014
Nakamasa Inoue, Zhuolin Liang, Mengxi Lin, Tran Hai Dang, Koichi Shinoda, Zhang Xuefeng, Kazuya Ueki
Proc. TRECVID workshop, pp. 1-13, Nov. 9, 2014

国内会議(査読なし)

Error Correction Using Long Context Match for Smartphone Speech Recognition
Yuan Liang, Koji Iwano, Koichi Shinoda
Technical Reports of IPSJ SLP, vol. 104, no. 22, pp. 1-6, Dec. 16, 2014

An Efficient Error Correction Method for Smartphone Speech Recognition
Yuan Liang, Koji Iwano, Koichi Shinoda
Proc. ASJ 2014 Autumn Meeting, pp. 29-30, Sep. 5, 2014

口唇の深度画像を用いたマルチモーダル音声認識
押尾翔平, 岩野公司, 篠田浩一
情報処理学会研究報告 SLP, vol. 102, no. 2, pp. 1-6, Jul. 24, 2014

Collection and analysis of multi-party interaction data for automatic boredom recognition
Nataliia Biriukova, Kotaro Funakoshi, Koichi Shinoda
Proc. The 28th Annual Conference of the Japanese Society for Artificial Intelligence (JSAI) 2014, pp. 1-4, May 13, 2014

Deep Learningを用いた映像のセマンティックインデクシングのための特徴次元削減
森宏太郎, 井上中順, 篠田浩一
2014年電子情報通信学会総合大会講演論文集, pp. 85, Mar. 18, 2014

Velocity Pyramid for Event Detection
Zhuolin Liang, Nakamasa Inoue, Koichi Shinoda
Technical Reports of IEICE PRMU, vol. 113, no. 493, pp. 13-18, Mar. 13, 2014

Discriminatively Trained PLDA with Partially Preserved Model Assumptions in Speaker Verification
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda
Proc. ASJ 2014 Spring Meeting, pp. 99-100, Mar. 12, 2014

Training Multiple PLDA Models by Clustered I-Vectors for Speaker Verification
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda
Proc. ASJ 2014 Spring Meeting, pp. 97-98, Mar. 12, 2014

Robust 0-1 Loss Training for PLDA in Speaker Verification
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda
Proc. ASJ 2014 Spring Meeting, pp. 101-102, Mar. 12, 2014

TRECVID 映像意味インデクシングのための音声・音響技術
井上中順, 森宏太郎, Liang Zhuolin, 篠田浩一
日本音響学会2014年春季研究発表会講演論文集, pp. 129-130, Mar. 11, 2014

高速な画像分類のためのNeighbor-to-Neighbor探索
井上中順, 篠田浩一
電子情報通信学会技術研究報告 PRMU, vol. 113, no. 493, pp. 97-102, Mar. 6, 2014

「音声認識」は今後こうなる！
河原達也, 篠田浩一, 堀貴明, 堀智織, 篠崎隆宏
SIG-SLP第100回記念シンポジウム, page 6, Jan. 31, 2014

基調講演

映像意味検索の未来
篠田浩一
第17回画像の認識・理解シンポジウム (MIRU), Jul. 29, 2014

招待講演・チュートリアル

Deep Learningによる新しい音声認識パラダイム
篠田浩一
日本神経回路学会主催セミナー「Deep Learningが拓く世界」, Aug. 26, 2014

Neighbor-To-Neighbor Search for Fast Coding of Feature Vectors
井上中順, 篠田浩一
第17回画像の認識・理解シンポジウム (MIRU), Jul. 29, 2014

映像意味検索技術の最新動向
篠田浩一
NEC Laboratories, Jul. 4, 2014

Robust Video Information Retrieval using Speech Technologies
Koichi Shinoda
Language Technologies Institute, Carnegie Mellon University, Jun. 20, 2014

映像検索への音声工学からのアプローチ
篠田浩一
音学シンポジウム2014, May 24, 2014

映像意味検索技術の最新動向
篠田浩一
日本音響学会2014年春季研究発表会講演論文集, pp. 531-532, Mar. 10, 2014

映像意味検索の現状と課題
篠田浩一
電子情報通信学会技術研究報告 EMM, vol. 113, no. 480, pp. 1-2, Feb. 28, 2014

Video Semantic Indexing Using Speech Technologies
Koichi Shinoda
Dublin City University, Jan. 6, 2014

選抜講演

Semantics for Large-Scale Multimedia: New Challenges for NLP
Florian Metze, Koichi Shinoda
ACL2014, Jun. 22, 2014

2013

論文(査読あり)

q-Gaussian Mixture Models for Image and Video Semantic Indexing
Nakamasa Inoue, Koichi Shinoda
Journal of Visual Communication and Image Representation, vol. 24, no. 8, pp. 1450-1457, Nov. 15, 2013

Event detection in consumer videos using GMM supervectors and SVMs
Yusuke Kamishima, Nakamasa Inoue, Koichi Shinoda
EURASIP Journal on Image and Video Processing, vol. 2013:51, pp. 1-13, Sep. 2, 2013

A statistical approach for person verification using human behavioral patterns
Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda
EURASIP Journal on Image and Video Processing 2013, 2013:44, pp. 1-11, Aug., 2013

Detection of overlapped speech using lapel microphones in meeting
Ryo Yokoyama, Yu Nasu, Koji Iwano, Koichi Shinoda
Speech Communication, vol. 55, pp. 941-949, Jun. 27, 2013

Feature normalization based on non-extensive statistics for speech recognition
Hilman F. Pardede, Koji Iwano, Koichi Shinoda
Speech Communication, vol. 55, pp. 587-599, Mar., 2013

国際会議(査読あり)

Neighbor-To-Neighbor Search for Fast Coding of Feature Vectors
Nakamasa Inoue, Koichi Shinoda
2013 IEEE International Conference on Computer Vision, pp. 1233-1240, Dec. 3, 2013

Statistical Person Verification Using Behavioral Patterns from Complex Human Motion
Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda
New Trends in Image Analysis and Processing ICIAP 2013, pp. 550-558, Sep. 9, 2013

Combining Deep Speaker Specific Representations with GMM-SVM for Speaker Verification
Ryan Price, Sangeeta Biswas, Koichi Shinoda
INTERSPEECH2013, pp. 2788-2792, Aug. 25, 2013

国内会議(査読なし)

A Regression Approach to Emotion Estimation in Spontaneous Speech
Qiongqiong Wang, Koichi Shinoda
2013 Autumn Meeting ASJ, pp. 87-88, Sep. 25, 2013

Fusing deep speaker specific features and MFCC for robust speaker verification
Ryan Price, Koichi Shinoda, Sangeeta Biswas
IPSJ SIG technical reports, Vol. 2013-SLP-97, No. 3, pp. 1-7, Jul. 25, 2013

大語彙手話認識のための動素決定木クラスタリング
安中哲也, 篠田浩一
第19回画像センシングシンポジウム, pp. IS3-18-1 to IS3-18-8, Jun. 12, 2013

多人数対話ロボットの実現にむけたマルチモーダル対話データの収集と分析
石川真也, 船越孝太郎, 篠田浩一, 中野幹生
2013年度人工知能学会全国大会(JSAI)論文集, pp. 224-227, Jun. 4, 2013

Speaker verication using deep speaker-discriminative representations
Ryan Price, Koichi Shinoda
2013 Spring Meeting ASJ, pp. 81-82, Mar. 13, 2013

発声様態依存モデルを用いた話者認識
小塚俊来, 岩野公司, 篠田浩一
日本音響学会講演論文集, pp. 185-188, Mar. 13, 2013

音声認識のためのq ガウス分布を用いた音響モデル
周澤西, 岩野公司, 篠田浩一
日本音響学会講演論文集, pp. 175-178, Mar. 13, 2013

話者認識技術の現状と課題
網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 越仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, 王龍標
電子情報通信学会技術研究報告, Vol. 112, No. 450, pp. 63-70, Feb. 28, 2013

GMM Supervectorとビデオクリップスコアを用いた映像のセマンティックインデクシング
井上中順, 篠田浩一
電子情報通信学会技術研究報告, vol. 112, no. 441, pp. 173-178, Feb. 21, 2013

カメラの動き補正に基づく時空間特徴量とGMM supervectorを用いた映像からのイベント検出
上嶋勇祐, 井上中順, 篠田浩一
電子情報通信学会技術研究報告, vol. 112, no. 441, pp. 185-190, Feb. 21, 2013

解説・総説

Machine Learning for Multimedia Sequential Pattern Recognition
Koichi Shinoda, Jen-Tzung Chien
2013 APSIPA Tutorial #5, Oct. 29, 2013

What speech researchers should know about video technology!
Koichi Shinoda, Florian Metze
Tutorial at INTERSPEECH2013, Aug. 25, 2013

話者認識の国際動向
越仲孝文, 篠田浩一
日本音響学会誌, vol. 69, no. 7, pp. 342-348, Jul. 1, 2013

Reusing Speech Techniques for Video Semantic Indexing
Koichi Shinoda, Nakamasa Inoue
IEEE signal processing magazine, Vol. 30, No. 2, pp. 118-122, Mar., 2013

招待講演・チュートリアル

TRECVideo Semantic Indexing
Koichi Shinoda
Yahoo! Japan Research, Nov. 25, 2013

Statistical Video Semantic Indexing
Koichi Shinoda
National Chiao Tung University (國立交通大学), Oct. 27, 2013

2012

論文(査読あり)

Online speaker clustering using incremental learning of an ergodic hidden Markov model
Takafumi Koshinaka, Kentaro Nagatomo, Koichi Shinoda
IEICE TRANS. INF. & SYST, Vol. E95-D, No. 10, pp. 2469-2478, Oct., 2012

Active Learning Using Phone-Error Distribution for Speech Modeling
Hiroko MURAKAMI, Koichi SHINODA, Sadaoki FURUI
IEICE TRANS. INF. & SYST, Vol. E95-D, No. 10, pp. 2486-2494, Oct., 2012

A Fast and Accurate Video Semantic-Indexing System Using Fast MAP Adaptation and GMM Supervectors
Nakamasa Inoue, Koichi Shinoda
IEEE Transactions on Multimedia, vol. 14, Issue: 4 Part 2, pp. 1196-1205, Aug., 2012

音声認識におけるモデル間スケーリング係数の自動推定
大西祥史, 江森正, 越仲孝文, 篠田浩一
電子情報通信学会論文誌, Vol. J95-D, No. 5, pp. 1276-1285, May 1, 2012

Robust Gait-Based Person Identification against Walking Speed Variations
Muhammad Rasyid AQMAR, Koichi SHINODA, Sadaoki FURUI
IEICE Trans. Inf. & Syst, Vol. E95-D, No. 2, pp. 668-676, Feb. 1, 2012

国際会議(査読あり)

Acoustic Model Training Using Committee-Based Active and Semi-Supervised Learning for Speech Recognition
Tsutaoka Takuya, Koichi Shinoda
APSIPA ASC 2012, Dec. 4, 2012

Efficient model training for HMM-based person identification by gait
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui
Proceedings of 2012 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, Dec., 2012

q-Gaussian Mixture Models Based on Non-Extensive Statistics for Image And Video Semantic Indexing
Nakamasa Inoue, Koichi Shinoda
ACCV2012, Nov. 5, 2012

MULTIMEDIA EVENT DETECTION USING GMM SUPERVECTORS AND SVMS
Yusuke Kamishima, Nakamasa Inoue, Koichi Shinoda, Shunsuke Sato
ICIP 2012, pp. 3089-3092, Oct. 3, 2012

Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity
Ryo Yokoyama, Yu Nasu, Koichi Shinoda, Koji Iwano
InterSpeech2012, Sep. 12, 2012

Q-Gaussian based spectral subtraction for robust speech recognition
Hilman F. Pardede, Koichi Shinoda, Koji Iwano
InterSpeech2012, Sep. 11, 2012

Non-extensive Statistics for Feature Normalization in Speech Recognition
Hilman F. Pardede, Koichi Shinoda
Proc. International Workshop on Statistical Machine Learning for Speech Processing (IWSML) 2012, Mar., 2012

国際会議(査読なし)

Tokyo Tech Speaker Recognition
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda
NIST SRE 2012, Dec. 11, 2012

TokyoTechCanon at TRECVID 2012
Nakamasa Inoue, Yusuke Kamishima, Kotaro Mori, Koichi Shinoda
TRECVID 2012, Nov. 26, 2012

国内会議(査読なし)

ディープラーニングを用いた日本語大語彙話し言葉音声認識
西野大輔, 篠田浩一, 古井貞熙
日本音響学会2012年秋季研究発表会講演論文集, Sep. 20, 2012

映像のセマンティックインデクシングのためのq-混合ガウス分布
井上中順, 篠田浩一
信学技報, Vol. 112, No. 197, pp. 31-36, Sep. 2, 2012

Video Semantic Indexing Using GMM-Supervectors
Nakamasa Inoue, Koichi Shinoda
Greater Tokyo Area Multimedia/Vision Workshop, Aug. 30, 2012

A video watermarking method to objects robust against various attacks
Ta Minh THANH, Koichi SHINODA
IEICE Technical Report, Vol. 112, No. 190, pp. 43-48, Aug. 27, 2012

複数ピンマイクで収音された会議音声の重畳区間検出
横山諒, 那須悠, 岩野公司, 篠田浩一
情報処理学会研究報告, Vol. 2012-SLP-92, No. 6, Jul. 20, 2012

クラウド時代の新しい音声研究パラダイム
秋葉友良, 岩野公司, 緒方淳, 小川哲司, 小野順貴, 篠崎隆宏, 篠田浩一, 南條浩輝, 西崎博光, 西田昌史, 西村竜一, 原直, 堀貴明
情報処理学会研究報告, Vol. 2012-SLP-92, No. 4, Jul. 19, 2012

Multimodal Interface for Error Correction in Speech Recognition
Koichi Shinoda
Microsoft Research Asia IJARC CORE7 Project Summary Booklet, pp. 15-16, Jun. 29, 2012

GMM-Supervectorを用いた映像の高速セマンティック検索システム
井上中順, 篠田浩一
第18回画像センシングシンポジウム講演論文集, DS2-08, Jun. 11, 2012

Speaker Adaptation for Dialog Act Recognition
Johan Rohdin, Koichi Shinoda
2012 Spring Meeting ASJ, p. 111, Mar. 21, 2012

コミッティに基づく能動学習・半教師付き学習を用いた音声モデル
蔦岡拓也, 篠田浩一
日本音響学会2012年春季研究発表会講演論文集, pp. 55-56, Mar. 21, 2012

相互スペクトル減算と振幅スペクトル相関を用いた会議音声の重畳区間検出
横山諒, 那須悠, 篠田浩一, 岩野公司
日本音響学会2012年春季研究発表会講演論文集, pp. 13-14, Mar. 21, 2012

MAP Adaptation Using Multiple Priors for Speaker Verication
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda, Sadaoki Furui
2012 Spring Meeting ASJ, pp. 79-82, Mar. 19, 2012

A Compensation Technique Using q-Logarithm for Noisy Speech Recognition
Hilman F. Pardede, Koichi Shinoda, Koji Iwano
2012 Spring Meeting ASJ, pp. 19-20, Mar. 19, 2012

Spectral Subtraction Based on q-Gaussian Assumption for Noise Robust Speech Recognition
Hilman F. Pardede, Koichi Shinoda, Koji Iwano
2012 Spring Meeting ASJ, pp. 21-22, Mar. 19, 2012

Recognition of Indonesian Code-Switching Speech
Yonatan Andy Fajar Nugraha, Koichi Shinoda, Sadaoki Furui, Koji Iwano
2012 Spring Meeting ASJ, pp. 75-76, Mar., 2012

Language Model for Efficient Error Correction in Speech Recognition
Yuan Liang, Koichi Shinoda, Sadaoki Furui
2012 Spring Meeting ASJ, pp. 89-90, Mar., 2012

手話素単位を用いた大語彙手話認識
佐藤新, 篠田浩一
電子情報通信学会技術研究報告, No. PRMU2011-222, pp. 155-160, Feb. 9, 2012

GMM-SupervectorとSVMを用いた映像からのイベント検出
上嶋勇祐, 井上中順, 篠田浩一, 佐藤俊介
電子情報通信学会技術研究報告, No. PRMU2011-230, pp. 195-200, Feb. 2, 2012

Subject adaptation and adaptive training for gait-based person identification
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui
IEICE Technical Report, No. PRMU2011-199, pp. 77-82, Feb., 2012

Two-pass approach for recognizing code-switching speech
Yonatan Andy Fajar Nugraha, Koichi Shinoda, Sadaoki Furui
IEICE Technical Report, No. SP2011-150, pp. 225-229, Feb., 2012

固定監視カメラからの人混み中の行動イベント検出
和田俊也, 篠田浩一
電子情報通信学会技術研究報告, No. PRMU2011-173, pp. 257-262, Jan. 19, 2012

基調講演

Speech Technology Plays a Key Role in Video Semantic Indexing
Koichi Shinoda
First International Workshop on Audio and Multimedia Methods for Large-Scale Video Analysis (AMVA) at ACM Multimedia 2012, pp. 1-2, Oct. 29, 2012

解説・総説

映像検索技術の新たな潮流
篠田浩一
電子情報通信学会誌, Vol. 95, No. 10, pp. 932-938, Oct., 2012

音声認識における転移学習：話者適応
篠田浩一
人工知能学会誌, vol. 27, no. 4, pp. 359-364, Jul. 1, 2012

招待講演・チュートリアル

コミュニケーションとしての映像とその検索
篠田浩一
第15回情報理論的学習理論ワークショップ(IBIS2012), Nov. 7, 2012

映像検索技術の最新動向
篠田浩一
産業計測第36委員会研究会, Oct. 25, 2012

Mobile or Cloud-based Photo/Video Analytics?
Winston Hsu, Kunio Kashino, Keiichiro Hoashi, Koichi Shinoda, Duy-Dinh Le, Masanori Sugimoto
Greater Tokyo Area Multimedia/Vision Workshop, Aug. 30, 2012

映像検索技術の最前線
篠田浩一
第18回画像センシングシンポジウム講演論文集, OS3-02-1-4, Jun. 11, 2012

2011

論文(査読あり)

Committee-Based Active Learning for Speech Recognition
yuzo hamanaka, Koichi Shinoda, Takuya Tsutaoka, SADAOKI FURUI, Tadashi Emori, Takafumi KOSHINAKA
IEICE Trans. Inf. & Syst, vol. E94-D, No. 10, pp. 2015-2023, Oct. 1, 2011

Semi-synchronous speech and pen input for mobile user interfaces
Koichi Shinoda, Yasushi Watanabe, Kenji Iwata, Yuan Liang, Ryuta Nakagawa, Sadaoki Furui
Speech Communication, Vol. 53, pp. 283-291, Mar., 2011

国際会議(査読あり)

Designing text corpus using phone-error distribution for acoustic modeling
Hiroko Murakami, Koichi Shinoda, Sadaoki Furui
Proc. IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2011, pp. 191-195, Dec. 11, 2011

Person Authentication using 3D Human Motion
Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda
Proc. Joint ACM Workshop on Human Gesture and Behavior Understanding 2011 (J-HGBU '11), pp. 35-40, Nov. 28, 2011

A Fast MAP Adaptation Technique for GMM-supervector-based Video Semantic Indexing Systems
Nakamasa Inoue, Koichi Shinoda
Proc. ACM Multimedia 2011, pp. 1357-1360, Nov. 28, 2011

Noise Robust Speech Recognition based on Spectral Reduction Measure
Mayumi Beppu, Koichi Shinoda, Sadaoki Furui
Proc. APSIPA ASC 2011, No. PM.PS2, Oct. 18, 2011

Acoustic Forest for SMAP-based Speaker Verification
SANGEETA BISWAS, Marc Ferras, Koichi Shinoda, SADAOKI FURUI
Proc. INTERSPEECH2011, pp. 2377-2380, Aug. 27, 2011

Structual Joint Factor Analysis for Speaker Recognition
Marc Ferras, Koichi Shinoda, SADAOKI FURUI
Proc. INTERSPEECH2011, pp. 2373-2376, Aug. 27, 2011

Generalized-Log Spectral Mean Normalization for Speech Recognition
Hilman Pardede, Koichi Shinoda
INTERSPEECH, pp. 1645-1648, Aug. 27, 2011

Structual MAP adaption in GMM-supervector based speaker recognition
Marc Ferras, Koichi Shinoda, Sadaoki Furui
Proc. ICASSP2011, pp. 5432-5435, May 22, 2011

Cross-channel spectral subtraction for meeting speech recognition
Yu Nasu, Koichi Shinoda, Sadaoki Furui
Proc. ICASSP2011, pp. 4812-4815, May 22, 2011

国際会議(査読なし)

TokyoTech+Canon at TRECVID 2011
Nakamasa Inoue, Yusuke Kamishima, Toshiya Wada, Koichi Shinoda, Shunsuke Sato
Proc.TRECVID Workshop 2011, Dec. 5, 2011

Multimodal Interface for Error Correction in Speech Recognition
Koichi Shinoda
Microsoft Research Asia IJARC CORE6 Project Summary Booklet, Jun. 13, 2011

国内会議(査読なし)

Speaker verification using MMAP adaptation
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda, Sadaoki Furui
IEICE Technical Report, No. SP2011-93, pp. 133-137, Dec., 2011

複数マイクロフォンを用いた音声区間検出
大西祥史, 篠田浩一, 越仲孝文
日本音響学会 2011年秋季研究発表会講演論文集, pp. 37-38, Sep. 20, 2011

GMM尤度補正を用いた耐雑音音声認識
古井貞熙, 那須悠, 篠田浩一
日本音響学会2011年秋季研究発表会講演論文集, pp. 29-32, Sep., 2011

Speaker Adaptation for Dialogue Act Classification
Johan Rohdin, Koichi Shinoda
IPSJ SIG Technical Report, Vol. 2011-SLP-87, No. 8, Jul. 21, 2011

Nonlinear Normalization Using q-Logarithm for Robust Speech Recognition
Hilman, Koichi Shinoda, Koji IWANO
IEICE Technical Report, Vol. 111, No. 153, pp. 45-50, Jul. 21, 2011

木構造GMMを用いたセマンティックインデクシングの高速化
井上中順, 篠田浩一
電子情報通信学会技術研究報告 PRMU, vol. 111, no. 77, pp. 105-110, Jun., 2011

Voting Approach in SMAP Adaptation for Speaker Verification
Sangeeta Biswas, Marc Ferras, Koichi Shinoda, Sadaoki Furui
, No. 2-5-2, pp. 45-48, Mar., 2011

音響モデル学習のための相対エントロピーを用いた学習文選択手法
村上博子, 篠田浩一, 古井貞熙
日本音響学会2011年春季講演論文集, No. 1-5-7, pp. 17-20, Mar., 2011

雑音下音声におけるスペクトル縮小の分析とその耐雑音音声認識への利用
別府真由美, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, SP-2010-122, pp. 43-48, Mar., 2011

音響モデル学習のための相対エントロピーを用いた学習文選択
村上博子, 篠田浩一, 古井貞熙
情報処理学会研究報告, Vol. 2011-SLP-85, No. 3, pp. 1-6, Feb., 2011

映像解析・検索評価ワークショップTRECVID2010の概要
篠田浩一, 佐藤真一
電子情報通信学会技術研究報告 PRMU, vol. 110, no. 414, pp. 19-24, Feb., 2011

マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング
井上中順, 上嶋勇祐, 篠田浩一
電子情報通信学会技術研究報告 PRMU, vol. 110, no. 414, pp. 25?30, Feb., 2011

専門書

Robust speech recognition in the car environment
Agnieszka Betkowska Cavalcante, Koichi Shinoda, Sadaoki Furui
LTC 2009, LNAI 6562, pp. 24-34, Jul. 11, 2011

招待講演・チュートリアル

［特別講演］映像の高性能なセマンティックインデクシングを目指して
井上中順, 篠田浩一
電子情報通信学会技術研究報告, No. PRMU2011-140, pp. 89-94, Dec. 15, 2011

映像検索評価ワークショップTRECVID
篠田浩一
キヤノン・イノベイティブ技術フォーラム映像認識技術ワークショップ, Oct. 25, 2011

Speaker Adaptation Techniques for Automatic Speech Recognition
Koichi Shinoda
Proc. APSIPA ASC 2011, Oct., 2011

2010

論文(査読あり)

大規模映像資源のためのマルチモーダル高次特徴検出
井上中順, 斉藤辰彦, 篠田浩一, 古井貞熙
電子情報通信学会論文誌, Vol. J93-D, No. 12, pp. 2633-2644, Dec., 2010

(Invited Paper) Acoustic Model Adaptation for Speech Recognition
Koichi Shinoda
IEICE Transactions on Information and Systems, vol. E93-D, no. 9, pp. 2348-2362, Sep., 2010

シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別
望月貴裕, 藤井真人, 篠田浩一, 酒井善則
電子情報通信学会論文誌, Vol. J93-D, No. 6, pp. 1009-1023, Jun., 2010

国際会議(査読あり)

Dynamic Language Model Adaptation Using Keyword Category Classification
Hitoshi Yamamoto, Ken Hanazawa, Kiyokazu Miki, Koichi Shinoda
Proc. Interspeech 2010, pp. 2426-2429, Sep. 27, 2010

Robust Gait Recognition against Speed Variation
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui
Proc. ICPR2010, pp. 2190-2193, Aug., 2010

High-Level Feature Extraction Using SIFT GMMs and Audio Models
Nakamasa Inoue, Tatsuhiko Saito, Koichi Shinoda, Sadaoki Furui
Proc. ICPR2010, pp. 3220-3223, Aug., 2010

Speech Modeling Based on Committee-Based Active Learning
Yuzo Hamanaka, Koichi Shinoda, Sadaoki Furui, Tadashi Emori, Takafumi Koshinaka
Proc. ICASP2010, pp. 4350-4353, Mar., 2010

国際会議(査読なし)

TT+GT at TRECVID 2010 Workshop
Nakamasa Inoue, Toshiya Wada, Yusuke Kamishima, Koichi Shinoda, Ilseo Kim, Byungki Byun, Chin-Hui Lee
Proc. TRECVID Workshop 2010, Nov. 15, 2010

NIST SRE 2010:Tokyo Tech Speaker Recognition
Marc Ferras, Sangeeta Biswas, Koichi Shinoda, Sadaoki Furui
Proc. NIST 2010 Speaker Recognition Evaluation Workshop, Jun., 2010

国内会議(査読なし)

カテゴリ推定に基づく動的な言語モデル適応
山本仁, 花沢健, 三木清一, 篠田浩一
情報処理学会音声言語情報処理研究会 (SLP), Vol. 2010-SLP-84, No. 1, Dec. 20, 2010

Optimal use of trees in structural MAP adaptation for speaker verification
Sangeeta Biswas, Marc Ferras, Koichi Shinoda, Sadaoki Furui
IPSJ Technical Report, Vol. 2010-SLP-84, No. 26, pp. 1-5, Dec., 2010

Inter-speaker weighted MAP adaptation for GMM-supervector speaker recognition
Marc Ferras, Koichi Shinoda, Sadaoki Furui
IPSJ Technical Report, Vol. 2010-SLP-84, No. 12, pp. 1-4, Dec., 2010

Gait-based Person Identification Robust against Speed Variation using CHLAC features and HMMs
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui
, Vol. PRMU2010-92, SP2010-48, WIT2010-36, pp. 23-28, Oct., 2010

SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習
井上中順, 上嶋勇祐, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. PRMU2010-58, pp. 7-12, Sep., 2010

会議音声認識のためのスペクトル減算に基づく音源分離
那須悠, 篠田浩一, 古井貞熙
日本音響学会2010年秋季講演論文集, No. 3-10-13, pp. 627-630, Sep., 2010

フランス語における発声スタイルの違いがスペクトル特徴に与える影響の分析
別府真由美, Jean-Luc Rouas, Martine Adda-Decker, 篠田浩一, 古井貞熙
日本音響学会2010年秋季講演論文集, No. 3-1-2, pp. 257-260, Sep., 2010

ToFカメラによる3D手話認識
佐藤新, 篠田浩一, 古井貞熙
画像の認識・理解シンポジウム（MIRU2010), IS3-44, pp. 1861-1868, Jul., 2010

局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出
吉澤悠介, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. 2010-43,PMRU2010-31, MI2010-31, pp. 163-168, May, 2010

会議音声認識のためのスペクトル減算に基づくオンライン音源分離
那須悠, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. EA2010-2, SIP2010-2, SP2010-2, pp. 7-12, May, 2010

音響特徴を用いた映像からのイベント検出の研究
斉藤辰彦, 井上中順, 篠田浩一, 古井貞熙
日本音響学会2010年春季講演論文集, pp. 201-202, Mar., 2010

2009

論文(査読あり)

Automatic recognition of Indonesian declarative questions and statements using polynomial coefficients of the pitch contours
Nazrul Effendy, Koichi Shinoda, Sadaoki Furui, Somchai Jitapunkul
The Acoustical Society of Japan, Accoust. Sci. & Tech., No. 30, pp. 249-256, Apr., 2009

国際会議(査読あり)

Robust Speech Recognition In The Car Environment
Agnieszka Betkowska Cavalcante, Koichi Shinoda, Sadaoki Furui
the 4th Language and Technology Conference (LTC'09), pp. 39-43, Nov., 2009

Noise robust speech recognition using spectral subtraction and F0 information extracted by Hough transform
Hideki Yasui, Koichi Shinoda, Sadaoki Furui, Koji Iwano
Proc. Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference (APSIPA-ASC '09), pp. 631-634, Oct., 2009

Speaker Adaptation Based on Two-Step Active Learning
Koichi Shinoda, Hiroko Murakami, Sadaoki Furui
Proc. INTERSPEECH 2009, pp. 576-579, Sep., 2009

Online speaker clustering using incremental learning of an ergodic hidden markov model
Takafumi Koshinaka, Kentaro Nagatomo, Koichi Shinoda
Proc. ICASSP 2009, pp. 4093-4096, Apr., 2009

Independent component analysis for noisy speech recognition
Hsin-Lung Hsieh, Jen-Tzung Chien, Koichi Shinoda, Sadaoki Furui
Proc. ICASSP 2009, pp. 4369-4372, Apr., 2009

国際会議(査読なし)

TITGT at TRECVID 2009 Workshop
Nakamasa Inoue, Shanshan Hao, Tatsuhiko Saito, Koichi Shinoda, Ilseo Kim, Chin-Hui Lee
Proc. TRECVID Workshop (TRECVID 2009), Nov., 2009

Multimedia Information Retrieval Using Statistical Approach
Koichi Shinoda
Microsoft Research Asia 2009 Annual Workshop of IJARC, pp. 13, Jul. 14, 2009

国内会議(査読なし)

音声認識のための複数の認識器を利用した能動学習
濱中悠三, 江森正, 越中孝文, 篠田浩一, 古井貞煕
情報処理学会研究報告, Vol. 2009-SLP-79, No. 4, pp. 1-8, Dec., 2009

SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出
井上中順, 斉藤辰彦, 篠田浩一, 古井貞煕
電子情報通信学会技術研究報告, Vol. PRMU2009-106, pp. 97-102, Nov., 2009

音声認識のためのコミッティを用いた能動学習
濱中悠三, 江森正, 越仲孝文, 篠田浩一, 古井貞熙
日本音響学会2009年秋季講演論文集, No. 1-1-5, pp. 15-18, Sep., 2009

能動的な適応文選択に基づく話者適応化
村上博子, 篠田浩一, 古井貞熙
日本音響学会2009年春季講演論文集, pp. 191-194, Mar., 2009

ハフ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討
安井英己, 篠田浩一, 古井貞熙, 岩野公司
日本音響学会2009年春季講演論文集, pp. 35-38, Mar., 2009

統計的モデル選択によるシーン数の自動推定を用いた動画要約
山崎航史, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. PRUM2008-231, pp. 139-144, Feb., 2009

Gait Recognition Using CHLAC Features and Hidden Markov Model
MUHAMMAD RASYID, Koichi Shinoda, SADAOKI FURUI
IEICT Tachnical Report, Vol. PRUM2008-224, pp. 99-103, Feb., 2009

耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化
安井英己, 篠田浩一, 古井貞熙, 岩野公司
電子情報通信学会技術研究報告, Vol. SP2008-129, No. 2009-1, pp. 19-24, Jan., 2009

解説・総説

フレッシュアイズ映像研究現場紹介東京工業大学篠田研究室
井上中順, 篠田浩一
映像情報メディア学会誌, Vol. 63, No. 8, pp. 1116-1119, Dec., 2009

2008

国際会議(査読あり)

Automatically Estimating Number of Scenes for Rushes Summarization
Koji Yamasaki, Koichi Shinoda, Sadaoki Furui
Proc. TRECVID BBC Rushes Summarization Workshop (TVS 2008) at ACM Multimedia, pp. 129-133, Oct., 2008

Time-lag Adaptation for Semi-synchronous Speech and Pen Input
Yasushi Watanabe, Koichi Shinoda, SADAOKI FURUI
Proc. INTERSPEECH2008, pp. 2675-2678, Sep., 2008

Improvement of eigenvoice-based speaker adaptation by parameter space clustering
Shutaro Tanji, Koichi Shinoda, SADAOKI FURUI, Antonio Ortega
Proc. INTERSPEECH2008, pp. 1229-1232, Sep., 2008

Robust spoken term detection using combination of phone-based and word-based recognition
Kenji Iwata, Koichi Shinoda, SADAOKI FURUI
Proc. INTERSPEECH2008, pp. 2195-2198, Sep., 2008

国際会議(査読なし)

Tokyo Tech at TRECVID 2008
Shanshan Hao, Yusuke Yoshizawa, Koji Yamasaki, Koichi Shinoda, Sadaoki Furui
Proc. TRECVID Workshop (TRECVID 2008), Nov., 2008

Automatic score Scene Detection for Baseball Video
Koichi Shinoda, Kazuki Ishihara, Sadaoki Furui, Takahiro Mochizuki
Symposium on Large-Scale Knowledge Resources(LKR2008), pp. 226-240, Mar., 2008

国内会議(査読なし)

スペクトルサブトラクションとハフ変換による基本周波数情報を用いた耐雑音音声認識
安井英巳, 岩野公司, 篠田浩一, 古井貞熙
日本音響学会2008年秋季講演論文集, No. 1-1-2, p. 3-6, Sep., 2008

Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment
Kousuke Hiraki, Takahiro Shinozaki, Koji Iwano, Agnieszka Betkowska, Betkowska Agnieszka, Koichi Shinoda, SADAOKI FURUI
, Vol. SP2007-202, pp. 93-98, Mar., 2008

パラメータ空間のクラスタ化による固有声話者適応化の改良
丹治秀太朗, 篠田浩一, 古井貞熙, オルテガアントニオ
日本音響学会2008年春季講演論文集, No. 2-10-11, pp. 91-94, Mar., 2008

連続音素認識を用いた単語認識誤りに頑健な講演音声検索
岩田憲治, 篠田浩一, 古井貞熙
日本音響学会2008年春季講演論文集, No. 2-10-20, pp. 113-116, Mar., 2008

音声とペンの同時入力における個人差への適応化
渡邉康司, 篠田浩一, 古井貞熙
日本音響学会2008年春季講演論文集, No. 2-4-11, p. 55-58, Mar., 2008

木構造クラスタリングを用いた動画像からの高次特徴抽出
中村太一, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告no.491, PRMU2007-220, No. 491, pp. 37-42, Mar., 2008

専門書

パターン認識と機械学習（下）ベイズ理論による統計的予測
元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇, 赤穂昭太郎, 神嶌敏弘, 杉山将, 小野田崇, 池田和司, 鹿島久嗣, 賀沢秀人, 中島伸一, 竹内純一, 持橋大地, 小山聡, 井手剛, 篠田浩一, 山川宏
パターン認識と機械学習・ベイズ理論による統計的予測, page 433, Jul., 2008

2007

論文(査読あり)

投球の次ショットに重きを置いたシーンのパターン化と離散隠れマルコフモデルを用いた野球放送映像の自動イベント分類
望月貴裕, 藤井真人, 八木伸行, 篠田浩一
映像情報メディア学会誌, Vol. 61, No. 8, pp. 1139-1149, Aug., 2007

Robust Speech Recognition Using Factorial HMMs for Home Environments
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
EURASIP Journal on Advances in Signal Processing, Vol. 2007, No. 20593, May, 2007

国際会議(査読あり)

Home-Environment Adaptation of Phoneme Factorial Hidden Markov Models
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
Proc. EUSIPCO 2007, pp. 2380-2384, Sep., 2007

Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition
Hiroki Yamazaki, Koji Iwano, Koichi Shinoda, SADAOKI FURUI, Haruo Yokota
Proc. INTERSPEECH 2007, pp. 2349-2352, Aug., 2007

Predictive Minimum Bayes Risk Classification for Robust Speech Recognition
Jen-Tzung Chien, Koichi Shinoda, SADAOKI FURUI
Proc. INTERSPEECH2007, pp. 1062-1065, Aug., 2007

Automatic Estimation of Scaling Factors Among Probabilistic Models in Speech Recognition
Tadashi Emori, Yoshifumi Onishi, Koichi Shinoda
Proc. INTERSPEECH 2007, pp. 1453-1456, Aug., 2007

A Robust Scene Recognition System for Baseball Broadcast Using Date-Driven Approach
Ryoichi Ando, Koichi Shinoda, SADAOKI FURUI, Takahiro Mochizuki
Proc. CIVR2007, pp. 186-193, Jul., 2007

Semi-Synchronous Speech and Pen Input
Yasushi Watanabe, Kenji Iwata, Ryuta Nakagawa, Koichi Shinoda, SADAOKI FURUI
Proc. ICASSP 2007, pp. I-409-412, Apr., 2007

Speech Recognition Using FHMMs Robust against Nonstationary Noise
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
Proc. ICASSP 2007, pp. I-1029-1032, Apr., 2007

国際会議(査読なし)

An Interface Using Semi-synchronous Speech and Pen Input
Koichi Shinoda
Proc. IJARC(Microsoft)-Tokyo Institute of Technology Joint Symposium on The forefront of the Speech Recognition Research, Dec., 2007

TokyoTech's TRECVIC2007 Notebook
Taichi Nakamura, Koichi Shinoda, Sadaoki Furui
Proc. TRECVID 2007 Workshop, Nov., 2007

Comparative Study on Robust Speech Recognition against Nonstationary Noise in the Home Environment
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
Proc. Symposium on Large-Scale Knowledge Resources(LKR2007), pp. 175-178, Mar., 2007

Robust Scene Recognition Using Scene Context Information for Video Contents
Koichi Shinoda, Ryoichi Ando, Sadaoki Furui, Takahiro Mochizuki
Proc. International Symposium on Large-Scale Knowledge Resources(LKR2007), pp. 107-112, Mar., 2007

Presentation Scene Retrieval Exploiting Features in Videos Including Pointing and Speech Information
Takashi Kobayashi, Wataru Nakano, Haruo Yokota, Koichi Shinoda, Sadaoki Furui
Proc. Symposium on Large-Scale Knowledge Resources(LKR2007)., pp. 95-100, Mar., 2007

国内会議(査読なし)

音声認識における確率モデルの重み係数の自動推定
江森正, 大西祥史, 篠田浩一
電子情報通信学会技術研究報告, PRUM2007-104, pp. 49-54, Dec., 2007

数値列化したイベントシーンの学習と試合進行状況情報による制約条件を用いた野球映像イベント識別
望月貴裕, 藤井真人, 八木伸行, 篠田浩一
電子情報通信学会技術研究報告, PRUM2007-149, pp. 77-82, Dec., 2007

十分統計量を用いた教師なし話者適応における話者選択法
谷真宏, 江森正, 大西祥史, 越仲孝文, 篠田浩一
電子情報通信学会技術研究報告, PRUM2007-110, pp. 85-90, Dec., 2007

ハイブリッドモデルに基づく単視点ビデオデータにおける人間の歩行動作のトラッキング
閔庚甫, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, WIT2007-24, pp. 47-52, Aug., 2007

多段SVMを用いた頑健な動画ショット境界検出
宮村祐一, 中村太一, 篠田浩一, 古井貞熙
画像の認識・理解シンポジウム（MIRU 2007）IS-2-19, pp. 815-820, Jul., 2007

時系列データに対するデータ駆動型アプローチに基づく野球放送の頑健なシーン認識
安藤亮一, 篠田浩一, 古井貞熙, 望月貴裕
画像の認識・理解シンポジウム（MIRU 2007）IS-1-17, pp. 570-575, Jul., 2007

野球放送のためのデータ駆動型アプローチを用いた得点シーン検出
石原一樹, 安藤亮一, 篠田浩一, 古井貞煕, 望月貴裕
第13回画像センシングシンポジウム予稿集, pp. 513-518, Jun., 2007

スライド資料を用いた講義音声認識のための言語モデル適応
山崎裕紀, 岩野公司, 篠田浩一, 古井貞熙, 横田治夫
日本音響学会2007年春季講演論文集, 3-9-8, pp. 79-80, Mar., 2007

専門書

パターン認識と機械学習（上）：ベイズ理論による統計的予測
元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇, 赤穂昭太郎, 神嶌敏弘, 杉山将, 小野田崇, 池田和司, 鹿島久嗣, 賀沢秀人, 中島伸一, 竹内純一, 持橋大地, 小山聡, 井手剛, 山川宏, 篠田浩一
パターン認識と機械学習・ベイズ理論による統計的予測, Dec., 2007

2006

論文(査読あり)

Robust Scene Extraction Using Multi-Stream HMMs for Baseball Broadcast
Nguyen Huu Bach, Koichi Shinoda, Sadaoki Furui
IEICE Transactions on Information and Systems, Vol. E89-D, No. 9, pp. 2553-2561, Sep., 2006

国際会議(査読あり)

Robust scene Recognition Using Language Models for Scene Contexts
Ryoichi Ando, Koichi Shinoda, Sadaoki Furui, Takahiro Mochizuki
Proc. MIR2006, ACM Workshop2006, pp. 99-106, Oct., 2006

Towards Optimal Bayes Decision for Speech Recognition
Jen-Tzung Chien, Chin-Hsien Huang, Koichi Shinoda, Sadaoki Furui
Proc. ICASSP2006, pp. SLP-L2.6, May, 2006

国際会議(査読なし)

Multimedia Information Retrieval Using Pattern Recognition Techniques
Koichi Shinoda
Proc. Microsfot Research Asia IJARC 2nd Symposium, Nov., 2006

Tokyo Tech's TRECVID2006 Notebook
Taichi Nakamura, Yuichi Miyamura, Koichi Shinoda, Sadaoki Furui
Proc. TRECVID Workshops, Nov., 2006

FHMM for Robust Speech Recognition in Home Environment
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
Proc. International Symposium on Large-Scale Knowledge Resources (LKR), pp. 129-132, Mar., 2006

Robust Scene Recognition for Baseball Broadcast
Koichi Shinoda, Sadaoki Furui
Proc. International Symposium on Large-Scale Knowledge Resources (LKR), pp. 91-94, Mar., 2006

国内会議(査読なし)

講義音声認識における講義スライド情報の利用
山崎裕紀, 岩野公司, 篠田浩一, 古井貞熙, 横田治夫
電子情報通信学会技術報告, Vol. SP2006-122, pp. 43-48, Dec., 2006

音声とペンの準同期入力に対するマルチモーダル認識
岩田憲治, 渡邉康司, 中川竜太, 篠田浩一, 古井貞熙
日本音響学会 2006年秋季講演論文集, pp. 45-46, Sep., 2006

動画像インデクシングのためのシーン時系列の確率的言語モデル
安藤亮一, 篠田浩一, 古井貞熙, 望月貴裕
第12回画像センシングシンポジウム予稿集, pp. 513-518, Jun., 2006

音声とペン入力の同時入力に対する認識方式の検討
渡邉康司, 岩田憲治, 中川竜太, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. SP2006-19, pp. 49-54, Jun., 2006

ビデオ画像における人間の歩行動作の3次元トラッキング
閔庚甫, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. PRMU2006-2, pp. 7-12, May 14, 2006

野球中継番組を対象とした音響情報を用いたシーン認識
宮崎太郎, 中川弘充, 中川竜太, 岩野公司, 篠田浩一, 古井貞熙
日本音響学会2006年春季講演論文集, pp. 19-20, Mar., 2006

基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識
小林隆二, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. SP2005-197, pp. 77-82, Mar., 2006

基本周波数情報のグラフィカルモデリングによる音声認識
小林隆二, 篠田浩一, 古井貞熙
2006年日本音響学会春季講演論文集, pp. 39-40, Mar., 2006

Family Adaptation of Factorial HMMs for Personal Robots
Betkowska Agnieszka, Koichi Shinoda, Sadaoki Furui
日本音響学会 2006年春季講演, pp. 135-136, Mar., 2006

2005

国際会議(査読あり)

Robust highlight extraction using multi-stream Hidden Markov Models for baseball video
Koichi Shinoda, Sadaoki Furui, Nguen Huu Bach
Proc. International Conference on Image Processing 2005 (ICIP 2005), pp. III-173-176, Sep., 2005

国際会議(査読なし)

Scene recognition using Hidden Markov Models for video database
Koichi Shinoda, Nguyen Huu Bach, Sadaoki Furui, Naoki Kawai
Proc. Symposium on Large-Scale Knowledge Resources(LKR2005), pp. 107-110, Mar., 2005

Model optimization for noise discrimination in home environment
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
Proc. Symposium on Large-Scale Knowledge Resources (LKR2005), pp. 167-170, Mar., 2005

国内会議(査読なし)

Recognition of speech in non-stationary noise using Factorial HMMs
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
, No. 3-7-25, pp. 151-152, Sep., 2005

音声と手書き文字の同時入力によるインターフェースの検討
中川竜太, 小林唯, 小林隆二, 篠田浩一, 古井貞熙
日本音響学会2005年秋季講演論文集, No. 1-7-11, pp. 13-14, Sep., 2005

隠れマルコフモデルを用いた野球放送の自動的インデクシング
Nguyen Huu Bach, 篠田浩一, 古井貞煕
画像の認識・理解シンポジウム(MIRU2005), pp. 1113-1120, Jul., 2005

隠れマルコフモデルとMLLRによるゲーム適応を用いた野球放送の自動インデクシング
Nguyen Huu Bach, 篠田浩一, 古井貞煕
第11回画像センシングシンポジウム講演論文集, pp. 7-10, Jun., 2005

音声と手書き文字の同時入力インターフェース
中川竜太, 小林唯, 小林隆二, 篠田浩一, 古井貞熙
情報処理学会研究報告, Vol. 2005, No. SLP-56, pp. 29-34, May, 2005

弁別素性のグラフィカルモデリングによる音声認識
小林隆二, 篠田浩一, 古井貞熙
日本音響学会2005年春季講演論文集, No. 1-5-21, pp. 41-42, Mar., 2005

Noise discrimination using models with different structures
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
, No. 2-Q-7, pp. 111-112, Mar., 2005

専門書

Speech Recognition System in NEC
Takao Watanabe, Kaichiro Hatazaki, Ken-ichi Iso, Ryosuke Isotani, Koichi Shinoda, Keizaburo Takagi
Spoken Language Systems, pp. 34-46, Sep., 2005

Speech Recognition System in NEC
Koichi Shinoda
Spoken Language Systems, Dec., 2005

2004

論文(査読あり)

確率モデルによる音声認識のための話者適応化技術（サーベイ論文）
篠田浩一
電子情報通信学会論文誌, vol. J87-D, no. 2, pp. 371-386, Apr., 2004

確率モデルによる多声音楽演奏のMIDI信号のリズム認識
武田晴登, 篠田浩一, 嵯峨山茂樹
情報処理学会論文誌, Vol. 45, No. 3, pp. 670-679, Mar., 2004

国内会議(査読なし)

隠れマルコフモデルを用いた野球放送の自動的インデクシング
Nguyen Huu Bach, 篠田浩一, 古井貞熙
電子情報通信学会技術研究報告, Vol. PRMU2004, No. 107, pp. 13-19, Nov., 2004

A study of noise discrimination for personal robots
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui
, No. 1-1-6, pp. 11-12, Sep., 2004

隠れマルコフモデルを用いた野球放送の自動インデキシング
Nguyen Huu Bach, 篠田浩一, 古井貞煕
電子情報通信学会パターン認識・メディア理解研究会, pp. 11-12, Sep., 2004

動的特徴量を用いたHMMによる連続動作認識
Nguyen Huu Bach, 篠田浩一, 古井貞熙
電子情報通信学会 2004年総合大会, No. D-12-120, pp. 286, Mar., 2004

手書き文字の準同期入力を併用した音声認識手法の予備検討
市屋剛, 中川竜太, 篠田浩一, 古井貞熙
電子情報通信学会 2004年総合大会, No. D-14-007, pp. 148, Mar., 2004

解説・総説

音声情報処理技術の最先端: 2.統計的手法を用いた音声モデリングの高度化とその音声認識への応用
篠田浩一, 篠崎隆宏
情報処理学会学会誌, Vol. 45, No. 10, pp. 1012-1019, Oct., 2004

招待講演・チュートリアル

Robust Acoustic Modeling for Speech Recognition
Koichi Shinoda
Proc. International Workshop Beyond HMM, Vol. SP2004-82, pp. 7-12, Dec., 2004

2003

国内会議(査読なし)

パーソナルロボット向けの家庭内雑音に頑健な音声認識の検討
藤崎宣彦, 篠田浩一, 岩野公司, 古井貞熙
日本音響学会2003年秋季研究発表会講演論文集, Vol. 1, No. 1-6-11, pp. 21-22, Sep., 2003

確率モデルによる多声楽曲MIDI演奏からの楽譜推定
篠田浩一
情報処理学会研究報告, Vol. 2003-MUS-50, pp. 27-32, May, 2003

ハーモニッククラスタリングによる多重音基本周波数推定
亀岡弘和, 西本卓也, 篠田浩一, 嵯峨山茂樹
日本音響学会平成15年春季研究発表会講演論文集, Vol. 3-7-3, pp. 837-838, Mar., 2003

HMMを用いた多声部MIDI信号からの楽譜復元
武田晴登, 西本卓也, 篠田浩一, 嵯峨山茂樹
日本音響学会平成15年春季研究発表会講演論文集, Vol. 3-7-4, pp. 839-840, Mar., 2003

モデル適応と音響尤度補正を併用した雑音に頑健な音声認識
山本仁, 西本卓也, 篠田浩一, 嵯峨山茂樹
日本音響学会平成15年春季研究発表会講演論文集, Vol. 1-4-18, pp. 41-42, Mar., 2003

ハーモニッククラスタリングによる多重音基本周波数推定アルゴリズム
篠田浩一
情報処理学会研究報告, Mar., 2003

品詞情報と単語内位置情報を用いた話し言葉音声認識のための状態クラスタリング
五十川賢造, 西本卓也, 篠田浩一, 嵯峨山茂樹
日本音響学会平成15年春季研究発表会講演論文集, Vol. 1-4-4, pp. 7-8, Mar., 2003

Page updated

Report abuse