ご協力いただいた方ありがとうございました、現在2024年4月以降のポジションへの応募は検討しておりません。このページは先輩に倣い、今後の参考のために残しておきます。
東京都立大学にて音響・音声処理の研究に従事しています升山です。博士号取得 (2024年3月見込み) 後の就職先としてアカデミア・インダストリに関係なく研究ポジションを検討しています。興味をもっていただいた方はご連絡いただけると幸いです。
CV (in English) / masuyama-yoshiki[at]ed.tmu.ac.jp / Twitter
連続最適化と深層学習の両方を駆使しつつ、音響信号処理を幅広く進めています。主著論文はICASSPやInterspeechに採択されており、SLT2022ではBest Student Paper Awardをいただきました。これまで取り組んできた主な研究トピックは以下の通りです。
音声波形をスペクトログラム (音声の時間周波数表現のパワー) から推定する問題に取り組んできました。位相復元は非凸な最適化問題となり、古典的な手法 (交互射影アルゴリズム) では局所解にはまり高品質な音声を得ることができませんでした。自分は、(1) 交互射影アルゴリズムとDNNによる雑音除去の統合 (IEEE JSTSP2021; IEEE SPS Tokyo Joint Chapter Student Journal Paper Award)、(2) 時間周波数解析の知見に基づいたDNNの活用 (IEEE/ACM TASLP2022) など、信号処理分野で得られてきた知見とDNNを統合することで解釈性の高い・効率的な位相復元を実現してきました。
動画サイトから収集可能な大量の単一チャネル音信号と画像のペアデータを用いた自己教師あり表現学習が盛んに研究されています。似た種類の音源が複数存在するシーンの場合、各音源の方向 (画像内での位置) 情報からインスタンスを識別する上で重要です。そこで、多チャネル音信号と全方位画像の空間的な対応関係をもとに、音源になりうる物体を検出するDNN (IROS2020; IEEE RAS Japan Chapter Young Award) と各音源候補が音を出している区間を検出するDNN (情報処理学会全国大会; 学生奨励賞) を自己教師あり学習する枠組みを提案しました。自律移動ロボットの実証実験で収集されたデータにおいても有効性を確認しました。
複数のマイクロホンを用いた音声強調や音源分離は人間による聴取だけでなく、音声認識のフロントエンドとしても重要です。多チャネル音声強調・分離DNNの学習には 単一チャネルの音源分離・強調のロス関数が援用されることが一般的でした。自分は、信号処理で広く用いられてきた多チャネル混合音の確率モデルからロス関数を導出し音源分離 (Interspeech2019) や音声強調 (ICASSP2020) において有効性を確認しました。また、このアイデアを拡張し音源分離DNNを教師なし学習する枠組みも提案しております。博士課程では、多チャネル音源分離の実応用を見据えて低遅延化 (APSIPA2021) および分散デバイスの活用 (Interspeech2022) について研究を進めています。またCarnegie Mellon University滞在時には、多チャネル音声強調・自己教師あり特徴抽出・音声認識モデルを統合に関する研究に取り組み (SLT2022; Best Student Paper Award)、ESPnetでコードも公開しております。
学部・修士課程では早稲田大学 基幹理工学研究科 表現工学専攻 及川研究室に所属しておりました。直接指導してくださっていた先生の移動をきっかけに、博士課程では東京都立大学 システムデザイン研究科 情報科学域 小野研究室に在籍しております。また、LINE Corporation、産業技術総合研究所、Carnegie Mellon University、Amazon Web Servicesにて研究開発を行ってきました。
日本音響学会 学生・若手フォーラムのスタッフとして研究発表会に併設開催されるイベントの企画・運営を行ってきました。
研究では主にPython・MATLABを使用しており、Pytorch・TensorFlowなどの使用経験があります。
ESPnet上での音声強調レシピの作成および音声認識の学習・推論の経験があります。
TA・RAの経験に加え、自主ゼミ (Academic writing・凸最適化・Pytorchなど) の運営を行ってきました。
海外企業でのインターンシップの経験はありますが、英語は得意ではありません。
研究開発の成果をクレジットこみで公開できる環境であることを望みます (研究開発の成果の一部を国際会議へ投稿など) 。
世代の近い研究者とある程度長いスパンで課題に取り組めることを望みます。
裁量と予算をいただけたとしても、研究に取り組むメンバーの少ない環境は望みません。
アカデミアの場合、教授と自分 (例えばポスドク) と学生のみという環境は基本的に望みません。
勤務地およびリモート可/不可にこだわりはありません。