MLSEは2019年9月より、特定の目的のため年間を通じて活動するWG(Working Group、作業部会)を設置しています。WGでは、ガイドライン、事例集などの成果物に向けて参加者を集い定期的に活動を行います。毎年行われる夏合宿にて企画セッションも行います。
現在では以下のWGが活動しています。各WGの活動に興味がおありの方は、MLSE Discord にある各WGのチャンネルにご参加ください。チャンネル名は下記の各WG紹介の末尾に記載しています。
新規のWGを提案したい方は、MLSE運営委員 1名をリエゾン幹事として、 WG開設申請書 をその運営委員に提出してください。リエゾン幹事となる運営委員のあてがない場合、 MLSEのDiscord などにて呼びかけてください。夏合宿における企画セッション提案とともに4月末を目処にご提案いただき、夏から1年単位で活動していただくことが典型的なスケジュールとなります。
機械学習など、いわゆる人工知能技術を用いたシステムにおいては、システムができることと、ステークホルダがシステムに期待することの間のギャップ(これをここでは認知ギャップと呼ぶ)が大きいことが多く、そのことが多くの悲劇を生んでいる。
2024年10月に行われた湘南会議208 (Trustworthy Machine Learning System Engineering Techniques for Practical Applications) では、この認知ギャップを埋める方法には文書化、説明可能性、トレーサビリティ、透明性など複数の手(ここではモダリティと呼ぶ)があり、それらのうまい組み合わせが認知ギャップを埋めるのに効果的である可能性が指摘された。
本WGでは、認知ギャップが悲劇をもたらした事例、認知ギャップをうまく埋めることに成功した事例を収集し、IT以外の分野からの知見も活かして将来のAIシステムの認知ギャップを解消していく方法論を模索する。
幹事
丸山宏(花王/東大/PFN)
竹内広宜(武蔵大学)
Discordチャンネル
LLMの登場によって、言語運用能力の点で機械は人間並みの能力(ヒューマン・パリティ)を達成した。しかし、LLMは基本的に過去の模倣をしているに過ぎず、新たな知識を探索するためには、探索(最適化)の技術を深化させる必要がある[1]。現在の数理最適化、あるいはブラックボックス最適化の枠組みでは、目的関数や実行可能空間を動的に変化させるような問題設定はできない。しかしながら、真に新しい知識を探索するためには、探索中に探索問題そのものを変化させるような動的な枠組みが必要である。
本WGでは、以下のような方針で、新たな探索問題の枠組みを提案する。
過去に知られている動的計画法などを整理することで、動的な探索・最適化に関する様々なアイディアのタクソノミを作る(動的計画法、動的制約充足問題、制御理論、自律コンピューティング、…)
心理学・社会学・法学・生態学など他分野で知られている、事前に予測できない環境に動的にに適応するメカニズムについて知見をまとめる
上記の知見から、新たな探索問題の枠組みを提案する。新たな分野のリファレンスとなるような出版物(論文あるいは書籍)にまとめる
幹事
丸山宏(花王/東大/PFN)
杉山阿聖(Citadel AI)
discordチャネル
2020年にGPT-3が発表されて以来、様々なタスクに利用可能な基盤モデル・大規模言語モデルが次々と発表され、その活用が既に始まっている。複数のタスクに応用でき、Fine Tuningすることで特定タスクでより高い性能を発揮できるようになった一方で、大量のデータを必要とする、プロンプトのデザインを考える、などデータ収集に対する考慮や、モデルの解釈性の低さへの対応など、今後の機械学習を用いたシステム開発の在り方も大きく変わってくることが予想される。
本ワーキンググループ(WG)は、基盤モデル・大規模言語モデル(LLM)のシステム開発において、機械学習工学として取り組むべき課題の整理と解決策の探究を目的とする。特に、以下の目標達成を目指す:
特定ドメイン(問合せチャットボット、コンシェルジュなど)におけるLLM活用事例のケーススタディを実施し、実装詳細、成果、課題を明らかにする。
重点業界(金融、医療、法務など参加者のニーズに応じて)でのLLMシステム適用における技術的・倫理的課題を特定し、それらの解決策を提案する。
ドメインおよび業界ごとのLLM評価基準を作成し、その作成方法の標準化を図る。特に日本語モデルの評価に焦点を当てる。
RAG(Retrieval-Augmented Generation)などの最新技術を含むLLMシステム開発における機械学習工学的アプローチを整理し、ベストプラクティスを提案する。
ケーススタディや評価基準の作成を通じて得られた知見を共有し、各種ガイドラインへの掲載提案を行う。
幹事
江澤 美保(クレスコ)JSSST会員
石川 冬樹(国立情報学研究所)JSSST会員
百瀬 耕平(株式会社 日本総合研究所)
吉岡 信和(QAML株式会社/早稲田大学)JSSST会員
Discord チャンネル
MLOps という名のもとに、機械学習の本番環境での運用について、さまざまなプラクティスが大手クラウドベンダーやメガベンチャーを中心として発表されている。一方、機械学習の適用するための環境は非常に多様であり、すべてのプラクティスを画一的に適用することは困難である。たとえば、メガベンチャー以外では機械学習を扱うチームは数名のみであることも珍しくない。また、利用フェーズも実験的な取り組みから本格的な利用までさまざまに広がっている。
現在、それぞれの現場では自分たちの状況に合わせた MLOps のカスタマイズが必要となっているものの、どのようなフェーズが存在し、それぞれのフェーズでどのようなプラクティスの導入を検討すべきか明らかにはなっていない。このため、このワーキンググループでは機械学習の活用におけるそれぞれのフェーズと、それぞれのフェーズで検討すべき事項を明らかにし、標準として提案することを目指す。
幹事
杉山阿聖(Citadel AI)
久井裕貴(マネーフォワード)
太田満久(Ubie)
Discord チャンネル
機械学習の判断を意図的に誤らせたり、モデルや訓練データを窃取したりする攻撃の存在が報告され、学会等で盛んに議論されている。これらの攻撃により、金銭的・人的な被害を受ける恐れがあり、機械学習工学の観点で大きな課題となっている。
しかし、これらに対してAI開発者が取るべき対応についてはあまり議論されていない。本WGでは、機械学習システムのAI開発者が安全なシステムを開発時するために考慮すべきセキュリティ事項を整理し、セキュリティガイドラインとして整理する。特に、AIセキュリティの専門知識を持っていない可能性のあるAI開発者でも、安全な機械学習システムを開発するための方法も検討する。さらに、海外のAI開発者向けに英語版の作成も進める。
幹事
矢嶋純(富士通株式会社)
久連石圭(東芝)
林昌純(帝京平成大学)
Discordチャンネル