修士2年の 兒新治紀 くんと 小川 が国際会議で研究成果の発表を行いました。
オーストラリア・ゴールドコーストで開催されたパターン認識に関する国際会議 ACPR2025 にて、二件の発表を行いました。兒新くんは、横浜市立大学医学部看護学科・佐藤朝美教授との共同研究として、視覚言語モデルを活用した新たなパターン認識パラダイム について、 小川は昨年度修士課程を修了した中田道寛くんの代理として、映像を用いた家畜の監視を題材とした状態監視システム構築・運用フレームワークについて発表しました。実社会の課題をテーマに、最先端のAI技術を国際会議の場で議論できるのは本研究室の魅力のひとつです。興味のある人はぜひ、一緒にチャレンジしましょう。
Haruki Konii, Teppei Nakano, Mari Wakabayashi, Tomomi Sato, Tetsuji Ogawa, ``Image recognition framework via adaptive class descriptions with vision-language models,'' Proc. The 8th Asian Conference on Pattern Recognition (ACPR 2025), pp.397-411, Nov. 2025.
Michihiro Nakata, Teppei Nakano, Susumu Saito, Tetsuji Ogawa, ``Towards farmers' decision support: Explainable-by design modeling for calving sign detection in cattle,'' Proc. The 8th Asian Conference on Pattern Recognition (ACPR 2025), pp.427-441, Nov. 2025.
修士1年の 耕崎海斗 くんと学部4年の 谷口純 くんが国際会議で研究成果の発表を行いました。
シンガポールで開催された信号処理に関する国際会議 APSIPA2025 にて、二件の発表を行いました。耕崎くんは、横浜市立大学医学部看護学科・佐藤朝美教授との共同研究として、重症心身障害児とのコミュニケーション支援のために、目の開閉サインを安定して検出する技術 を発表しました。わずかな目の動きから児の感情を読み取ることを目指す、看護×AIの研究です。谷口くんは、株式会社第一興商との共同研究として、歌詞の意味を大規模言語モデルで解釈し、その世界観にあったカラオケ背景映像を自動で検索・選択する技術 を紹介しました。エンタメ×AIのユニークな応用研究です。
Kaito Kosaki, Teppei Nakano, Mari Wakabayashi, Tomomi Sato, Tetsuji Ogawa, ``Strong eye closure detection in children with profound intellectual and multiple disabilities using robust temporal difference features,'' Proc. The 17th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA2025), pp.2477-2482, Oct. 2025.
Tomoki Ariga, Jun Taniguchi, Yosuke Higuchi, Sayaka Toma, Kunihiro Abe, Rie Shigyo, Tetsuji Ogawa, ``Lyric-aware karaoke background video selection using large language models and moment retrieval,'' Proc. The 17th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA2025), pp.1492-1497, Oct. 2025.
この秋、新たに 博士課程1名、修士課程1名、学部4年生1名、科目等履修生1名 が小川研のメンバーとして加わり、研究室がさらににぎやかになりました。
これで、小林研・小川研あわせて 学生メンバーは合計37名 となりました。また、学部3年生8名が小川研で「プロジェクト研究B」を履修し、実データを使った研究テーマに取り組んでいます。
多様なバックグラウンドをもつ仲間と一緒に、新しい挑戦に取り組んでいけることを楽しみにしています。
博士後期課程3年の 西城耕平 くん、修士課程2年の 矢部拓真 くんが国際会議で研究発表を行いました。
イタリア・パレルモで開催された信号処理の国際会議 EUSIPCO2025 にて、二件の研究成果を発表しました。西城くんは、TF-Locoformer を題材として、「位置エンコーディング」(時系列や時間周波数上の並び順をどう表現するか)を網羅的に比較・検証した結果を発表しました。音源分離モデルの性能を引き出すための、足元からの丁寧な分析研究です。矢部くんは、クラウドソーシングによる音質主観評価のための資格試験の設計、とくに「どのような音声サンプルを試験用に選べば信頼できる結果が得られるか」という点に焦点を当てた研究成果を紹介しました。多人数にインターネット上で評価してもらう際のテストの作り方に踏み込んだ研究です。また、小川は「音声評価」に関するセッションの座長を務めました。
Kohei Saijo, Tetsuji Ogawa, ``A comparative study on positional encoding for time-frequency domain dual-path transformer-based source separation models,'' Proc. the 33rd European Signal Processing Conference (EUSIPCO2025), pp.446-450, Sept. 2025.
Takuma Yabe, Moe Yaegashi, Teppei Nakano, Tetsuji Ogawa, ``Necessity of voice sample selection in qualification tests for crowdsourced subjective audio quality evaluation,'' Proc. the 33rd European Signal Processing Conference (EUSIPCO2025), pp.261-265, Sept. 2025.
小林研・小川研合同で、軽井沢セミナーハウスにて夏合宿を開催しました。
合宿では、B4による卒論中間報告11件、M2による修論中間報告6件の発表が行われ、活発な質疑応答を通して研究テーマを深掘りしました。その後は、テニス・バスケ・サッカー・卓球などで盛り上がり、学年・研究グループの垣根をこえて交流する良い機会となりました。
発表者のみなさん、そして企画・運営をしてくれた幹事の皆さん、本当にお疲れさまでした!「しっかり研究して、しっかり遊ぶ」——そんなメリハリのある雰囲気も、この合同研究室の魅力です。
次席研究員の 樋口陽祐 くんが、音声分野トップレベルの国際会議で研究発表を行いました。
オランダ・アムステルダムで開催された、音声言語処理に関する国際会議 INTERSPEECH2025 にて、研究成果を発表しました。この研究では、大規模言語モデル(LLM)の強力な翻訳能力を活かして、エンドツーエンド音声翻訳の性能を高める手法を提案しました。音声から直接別言語のテキストへ翻訳するモデルに、LLMをうまく組み合わせることで、より信頼性の高い翻訳を実現しようとする研究です。また、小川は「話者認識」に関するセッションの座長を務めました。
Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi, ``End-to-end speech translation guided by robust translation capability of large language model,'' Proc. The 26th Annual Conference of the International Speech Communication Association (INTERSPEECH2025), pp.21-25, Aug. 2025.
小川が、産業技術総合研究所主催のセミナーにてチュートリアル講演を行いました。
産業技術総合研究所主催の 第87回人工知能セミナー「AI技術と風力発電」 において、風力発電の風車を対象とした予知保全(故障の前ぶれを早めに検知すること)に関するチュートリアル講演を行いました。
講演では、設備運用・保守における予知保全の考え方や、異常検知技術を実際に活用する際の注意点を解説し、具体例として 再生可能エネルギーデータ利活用学術連携(東大・産総研・中部大・早大) で開発中の、風車の振動信号を用いた異常検知技術を紹介しました。人工知能・信号処理技術が、再生可能エネルギーや社会インフラの安定運用に貢献していることが伝われば幸いです。
小川哲司,``風車の予知保全に向けた故障予兆検知技術,'' 産業技術総合研究所 第87回人工知能セミナー「AI技術と風力発電」,オンライン開催,Aug. 2025.
修士2年の 若山拓矢 くんと修士1年の 宮内健吾 くんが、福岡県ひびき灘沖で建設中の浮体式洋上風力発電所および関連施設を見学しました。
再生可能エネルギーデータ利活用学術連携(東大・産総研・中部大・早大)では,定期的に勉強会や施設見学を行っています。今回はその一環として,国内最大級の洋上風車と関連施設を実際に見学しました。
事業者の方々の意見交換を通じて,洋上の風車における状態監視の重要性 や,開発中の異常検知技術・その情報の見せ方も含めた「これからのメンテナンスの在り方」について、現場の視点から深く考える良い機会となりました。人工知能・信号処理研究が、再生可能エネルギーや社会インフラの安定運用と繋がっていくことを現場で体感できる、貴重な機会を提供いただいた株式会社グリーンパワーインベストメントの皆様に、心より感謝申し上げます。
小川研で取り組んできた「プロジェクト研究A」(学部3年生)の成果報告会を行いました。
どのプロジェクトも非常にレベルが高く、学生それぞれの興味や得意分野がよく表れた発表ばかりでした。発表者のみなさん、本当にお疲れさまでした!
今回取り組まれたプロジェクトは以下の通りです。学部3年生の段階から、多彩なテーマに挑戦できるのも本研究室の特徴です。
音楽系
主観的な歌唱評価の実現に向けたビブラート検知
音声系
音声認識の基本技術の習得(二名)
音声合成の基本技術の習得
音源分離の基本技術の習得
画像系
DINO-DETRを用いた物体検出
CNNを用いた画像処理の基本技術の習得
機械学習一般系
SimCLRにおけるデータ拡張が学習に与える影響
大規模言語モデルによる野菜の品質判定能力の検証
単子葉植物と双子葉植物の分類(二名によるグループワーク)
SVMにおけるカーネル関数の比較調査
SVMにおいてカーネル関数が性能に与える影響の調査とマルチカーネル学習の活用(二名によるグループワーク)
未知のマルウェアの振る舞い検知
統計的検定の基本技術の習得
機械学習勉強会でのPython演習(二名)
8月1日(土),2日(日)に,早稲田大学オープンキャンパスが開催されました.
小林研・小川研からは、研究室発スタートアップである エキュメノポリス社 が開発中の英会話能力判定技術の体験展示を行いました。多くの来場者のみなさんに、音声会話エージェント InteLLA と英語で対話してもらいながら、人工知能技術がどのように発話内容や話し方を評価するのかを体験していただきました。
「研究室で生まれた技術が、そのまま社会に出ていく」様子を感じてもらえる内容だったと思います。オープンキャンパスで興味を持ってくれたみなさん、ぜひ研究室で一緒に研究してみませんか?
修士課程2年の 兒新治紀 くんと学部4年生の 谷口純 くんが国内研究会にて研究発表を行いました。
京都国際会館で開催された 第28回画像の認識・理解シンポジウム(MIRU2025) にて、二件の研究成果を発表しました。兒新くんは、横浜市立大学医学部看護学科・佐藤朝美教授との共同研究として、視覚言語モデルを活用した新たなパターン認識パラダイム を、谷口くんは、株式会社第一興商との共同研究として、歌詞の意味を大規模言語モデルで解釈し、その内容にマッチしたカラオケ背景映像を自動で検索・選択する技術 を紹介しました。看護×AIやエンタメ×AIといった多様な応用研究を発信できるのも、本研究室の魅力と言えます。
兒新治紀,中野鐵兵,佐藤朝美,小川哲司,``視覚言語モデルを用いた適応的なクラス記述に基づく画像認識フレームワーク,'' 第28回画像の認識・理解シンポジウム (MIRU2025),IS-1-146,July 2025.
有賀智輝,谷口純,当間佐耶佳,阿部国大,執行里恵,小川哲司,``大規模言語モデルによる歌詞解釈記述とモーメント検索を用いたカラオケ背景映像の選択,'' 第28回画像の認識・理解シンポジウム (MIRU2025),IS-3-203,July 2025.
早稲田大学西早稲田キャンパスにて、音学シンポジウム2025 が開催されました。小川は、久しぶりに現地世話人として運営に参画しました。
本年度は、LINE・ヤフー所属で小林研OBでもある大町基さんを実行委員長とし、キャンパス大改装工事による会議室不足という厳しい条件の中、ギリギリの対面開催となりましたが、大町さんをはじめ幹事団の皆さんのご尽力により、会場は終始にぎやかな雰囲気で、とても盛況な研究会となりました。
研究室発のスタートアップである エキュメノポリス社からは、松山洋一さんによる招待講演「人の可能性を解き放つ対話型診断AIエージェントの開発」が行われました。 研究室で生まれたアイデアや技術が、起業や社会実装へとつながり、さらに学会の場でフィードバックを受けながら成長していく——その一端を感じられる貴重な機会になりました。
また、NHK技研の佐藤裕明さんが以下の共同研究で音声研究会研究奨励賞を受賞し、本シンポジウムの閉会式にて表彰されました。おめでとうございます!
佐藤裕明,佐久間旭,菅野竜雅,熊野正,河合吉彦,小川哲司,``Evidential deep learningを用いた不確実性に基づくストリーミング音声認識,'' 電子情報通信学会研究報告(SP),vol.124,no.391,SP2024-18,pp.1-6,March 2025.
修士課程2年の 兒新治紀 くん、若山拓矢くん、小林恵輔くん、中野研究員と小川が国内最大級の人工知能に関する学会の全国大会で研究発表を行いました。
大阪国際会議場で開催された 2025年度人工知能学会全国大会(JSAI 2025)にて、五件の研究成果を発表しました。テーマはいずれも、日本が抱えるリアルな社会課題を、AIでどう解決していくかに踏み込んだ応用研究です。兒新くんは、海洋研究開発機構や高知県水産試験場との共同研究として、「どこが良い漁場になりそうか」を半教師あり学習で予測するモデルについて発表しました。未探索海域のデータも活かして精度を高める工夫を行っています。中野研究員(2025年3月修士修了の中田道寛くんの代理)は、ファーマーズサポート社との共同研究の成果として、映像を用いた繁殖牛の分娩監視システムを実際の農場で運用して得られた知見を報告しました。小林くんは、北里大学との共同研究の成果として、繁殖牛の発情行動を映像から検知するための、深層物体検知モデルの利活用法について紹介しました。若山くんは、再生可能エネルギー利活用学術連携の成果として、風車の振動信号から故障の予兆を高精度かつ少量データでも頑健に検知する特徴表現の学習方法を提案しました。小川(2025年3月修士修了の望田康太くんの代理)は、横浜市立大学との共同研究の成果として、重症児の感情状態を、養育者の負担をできるだけ増やさずに推定し続けるためのフレームワークを紹介しました。人間参加型学習と視覚言語モデルを組み合わせたアプローチです。このように、漁業・畜産・再生可能エネルギー・看護など、様々な分野で役立つ人工知能技術を、本研究室から継続的に発信しています。「社会のリアルな課題 × AI」に興味がある人には、とてもやりがいのある環境だと思っています。
兒新治紀,中野鐵兵,宮澤泰正,小川哲司,``良漁場予測範囲絞り込みのためのPU学習を用いた未探索海域データの活用,'' 2025年度人工知能学会全国大会(JSAI2025),1Q4-GS-10-03, May 2025.
中田道寛,川島由理,中野鐵兵,春日良一,小川哲司,``映像を用いた繁殖牛分娩監視のための基盤モデルの開発と運用,'' 2025年度人工知能学会全国大会(JSAI2025),2O1-GS-10-01,May 2025.
小林恵輔,中野鐵兵,春日良一,日下裕美,坂口実,小川哲司,``映像からの繁殖牛発情行動検知における物体検出モデル利用に関する検討,'' 2025年度人工知能学会全国大会(JSAI2025),3win5-82,May 2025.
若山拓矢,井上太揮,深山覚,飯田誠,小川哲司,``振動信号による風車状態監視のための精密かつ少量データに頑健なモデリング,'' 2025年度人工知能学会全国大会(JSAI2025),4R3-GS-10-03,May 2025.
望田康太,中野鐵兵,若林麻里,佐藤朝美,小川哲司,``養育者に無理なく頼るモデル構築:重症児感情状態推定のための人間参加型学習および視覚言語モデルの活用,'' 2025年度人工知能学会全国大会(JSAI2025),4LS-OS-38-03,May 2025.
情報通信学科に進級した学生のみなさんを対象に、オリエンテーションを開催しました。
第一部では 卒業生による講演会、第二部では グループワーク を実施しました。
講演会では、小林研OGの 長谷川美夏さん(現 NTTデータ)、小川研OBの 松本和樹くん(現 東京農工大) をお招きし、現在の仕事・研究の内容や、早稲田での経験がどのように今のキャリアにつながっているか をお話しいただきました。講演後には質問の列ができ、先輩方に積極的に話を聞きにいく姿がとても印象的でした。
第二部のグループワークでは、進級振り分け直後でまだ面識の少ない仲間同士が交流できるよう、8人前後の少人数グループでのゲーム形式の活動 を行いました。学科の雰囲気にも少しずつ慣れつつ、「こんなことに興味がある」「何を重要と考えるか」といった話題で盛り上がっていました。
卒業生からのリアルなメッセージや、この日出会った同級生とのつながりが、今後の大学生活や進路選択にとって良いきっかけになってくれることを期待しています。
エジプト日本科学技術大学(E-JUST)との新たな国際連携プロジェクトがスタートし、Walid Gomaa 教授 が短期滞在で早稲田大学を訪れました。
国際協力機構(JICA)によるE-JUST設立支援は2025年1月で一区切りとなり、今後は E-JUSTをハブとして、日本とアフリカの大学を結ぶ学術ネットワークを強化するフェーズ に入っています。
その活動の一環として、Gomaa 教授とともに、映像を用いた回転機器の予知保全 に関する共同研究を開始しました。E-JUSTを中心として、カメルーンやナイジェリアの大学とも連携しながら、国際的な研究体制で進めていきます。Gomaa 教授は5月と7月に短期滞在し、講演やディスカッション、早稲田大学の機械系研究室でのデータ収集などを行いました。
アフリカのハブ大学であるE-JUSTとともに、科学技術イノベーション分野での国際協力と実社会で役立つ予知保全技術の発展 に、これからも微力ながら貢献していければと考えています。
国際共同研究や海外との連携に興味がある人にとっても、魅力的なプロジェクトになりそうです。
小林研・小川研合同の春合宿を、早稲田大学鴨川セミナーハウスにて実施しました。
春の合宿は、親睦を深めることだけを目的に、昼夜問わずひたすら遊ぶイベントです。今年は例年よりも一か月早い開催となりましたが、研究室配属直後のタイミングで、学年や研究テーマを超えて一気に交流が深まったように思います。
ここ数年の春合宿では、テニスやサッカーといった定番スポーツに加え、マイナー競技にも挑戦しています。今年は「ウィッフルボール」を楽しみました。コントロールは激烈に難しいですが,年寄でも楽しめました。運営を担当してくれたM1のみなさん、本当にお疲れさまでした。
次席研究員の 樋口陽祐 くんと博士3年の 西城耕平 くんが、国際会議にて研究発表を行いました。
インド・ハイデラバードで開催された、音声・音響信号処理に関する国際会議 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2025) にて,以下の研究成果を発表しました。この研究では、指示チューニングされた大規模言語モデル(LLM)のゼロショット能力を活かして、エンドツーエンド音声認識モデルの学習や出力を賢く誘導する手法を提案しています。音声認識とLLMという、洗練された二つの技術を組み合わせる最先端の研究テーマです。西城くんは Mitsubishi Electric Research Laboratories (MERL) でのインターンの成果を発表しました。また、小川は「話者のなりすまし」に関するセッションの座長を務めました。
Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi, ``Harnessing the zero-shot power of instruction-tuned large language model for guiding end-to-end speech recognition,'' Proc. 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2025), pp.1-5, April 2025.
本年度より、LLM-jp対話ワーキンググループ(東中グループ)に参画することになりました。
名古屋大学・東中竜一郎教授(統括・ToMベンチマーク)、慶應義塾大学・高道慎之介准教授(音声言語データ作成)らと連携しながら、日本語大規模言語モデルに関する研究開発を進めていきます。
小川研は、全二重型対話のための音声言語モデリングの開発を担当します。人とAIが同時にしゃべりながら自然に対話できるような、次世代の対話インタフェースを目指した研究です。
2025年度は、新たに学部4年生8名(うち修士課程進学予定4名)が小川研に配属され、顔合わせを行いました(小川研としては第10期生となります)。
これで、小川研の学生は博士課程2名・修士課程9名・学部8名の計19名となりました。小林・小川研で数えると学生だけで33名となります。さらに、学部3年生18名が小川研で「プロジェクト研究A」を履修し、早い段階から研究テーマに取り組み始めています。
規模は大きくなりつつも、日々の議論やゼミはアットホームな雰囲気で密に進める予定です。音声処理および機械学習・パターン認識の応用研究に本気で挑戦してみたい人は、ぜひ研究室の門をたたいてみてください。