Projects
人間の聴覚的な知覚を機械で再現することに関心を持ち、音声認識や環境音認識、異常音検知といった研究開発プロジェクトを推進してきました。
聴覚障がい者向け音声認識システムの開発
聴覚障がい者のコミュニケーション支援を目的とし、ユーザ辞書を用いた再学習不要の音声認識技術を開発しました。この技術により、人名や専門用語など、従来の音声認識技術では認識が困難だった単語も正確に認識することが可能になります。
関連論文:
“Contextualized Automatic Speech Recognition with Dynamic Vocabulary”, in Proc. SLT, 2024. (🏆IEEE SLT Best Paper Award🏆)
"DYNAC: Dynamic Vocabulary based Non-Autoregressive Contextualization for Speech Recognition", in Proc. INTERSPEECH, 2025.
招待講演:
"End-to-end音声認識の課題とDeep Biasingによるカスタマイズ", 電気音響研究会/応用音響研究会, 日本音響学会/電気情報通信学会, 2024.
書籍分担執筆:
“進化するヒトと機械の音声コミュニケーション Vol.2”, “2編1章3節 聴覚障がい者向け音声認識システムの開発”, エヌ・ティー・エス, 2025.
音源定位・分離・クラス分類を統合的に扱う新たな手法として、「環境音セグメンテーション」を提案しました。本手法により、従来の段階的処理で生じていた誤差の蓄積を防ぎ、高精度な環境音認識が可能であることを確認しました。扱う音のクラスは、咳やガラスの破損音、電話の着信音など、日常に存在する75種類に及びます。
関連論文:
"Multichannel Environmental Sound Segmentation with Separately Trained Spectral and Spatial Features", Applied Intelligence, 2021.
"Sound event aware environmental sound segmentation with Mask U-Net", Advanced Robotics, 2020.
招待講演:
"深層学習を用いた音源定位、音源分離、クラス分類の統合〜環境音セグメンテーション手法の紹介〜", Tokyo BISH Bash, 2021.
マイクロフォンアレイと機械学習技術を用いて、走行中に発生する異常音の検知および音源定位技術を開発しました。従来は検査員の聴覚に依存した主観的な評価により、検査精度にばらつきが生じていましたが、本技術により安定かつ客観的な自動検査が可能となります。
関連特許:
Abnormal sound determination apparatus and determination method, Patent US10607632B2
Abnormal sound detection apparatus and detection method, Patent US10475469B2
雑音の大きい工場環境でも高精度な作動音検査を可能にするアルゴリズムを開発しました。本技術は、作動音と周囲の雑音におけるピーク周波数の安定性の違いに着目し、従来は人の耳では聞き取りが難しかった騒音環境下でも、メーター音などの作動音を高精度に検出することを可能にしました。
関連特許:
音検査方法:出願日:2013年3月22日,特願2013-060012,特許公開2014-185902,特許第6033718号(2016年11月4日登録)
制御工学の技術である外乱オブザーバを用いて、作業中の工具振動を検知するアルゴリズムを開発しました。従来は、作業者が目視や耳で振動音を確認しながら切削条件を調整しており、熟練度に大きく依存していましたが、本技術により、経験に頼らず異常振動を検知できるようになります。
関連論文:
“エンドミル加工における外乱オブザーバを用いたセンサレスびびり振動検出技術の開発(第1報)”, 精密工学会誌, 2011. (🏆精密工学会研究奨励賞🏆)