適切なデータから学習された機械学習モデルは高い精度で画像の分類やテキストの生成、センサーの異常検知などの様々なタスクを解くことができます。特に現在は多くのタスクで深層ニューラルネットワークなどの複雑なモデルを用いることが標準的になってきています。複雑で高精度なモデルは便利ではありますが、同時にいくつかの信頼性の問題点も指摘されています。
複雑なモデルを実用する上での信頼性の課題の一つが、モデルの判断の理由をユーザが理解できない"ブラックボックス"の問題です。特に重要な意思決定の場面では、判断の理由がわからないとユーザは本当にモデルの判断に従ってよいのかがわかりません。本研究では、このような"ブラックボックス"の問題を緩和するために、モデルの判断の理由を説明させる説明技術の研究(説明可能AI)を行っています。
【関連するプロジェクト】
【関連する研究成果】
Kazuaki Hanawa, Sho Yokoi, Satoshi Hara, Kentaro Inui. Evaluation of Similarity-based Explanations. The 9th International Conference on Learning Representations (ICLR'21), 2021. [code]
Danqing Pan, Tong Wang, Satoshi Hara. Interpretable Companions for Black-Box Models. In Proceedings of the 23rd International Conference on Artificial Intelligence and Statistics (AISTATS'20), pages 2444--2454, 2020. [code][slide&video]
Satoshi Hara and Kohei Hayashi. Making Tree Ensembles Interpretable: A Bayesian Model Selection Approach. In Proceedings of the 21th International Conference on Artificial Intelligence and Statistics (AISTATS'18), pages 77--85, 2018. [code][poster]
モデルの判断の公平性も、機械学習モデルの信頼性における重要な課題です。機械学習モデルはときにデータから学習して欲しくないことまで学習してしまうことがあります。その代表例がデータに内在する差別的なバイアス(例えば男女差別)です。このようなバイアスを反映した不公平なモデルが実用されることは好ましくありません。本研究では、残念ながらこのような不公平なバイアスの存在をモデル所有者が秘匿できる可能性があることがわかってきています。
【関連する研究成果】
Gabriel Laberge, Ulrich Aïvodji, Satoshi Hara, Mario Marchand, Foutse Khomh. Fooling SHAP with Stealthily Biased Sampling. The 11th International Conference on Learning Representations (ICLR'23), 2023.
Ulrich Aïvodji, Hiromi Arai, Sébastien Gambs, Satoshi Hara. Characterizing the risk of fairwashing. Advances in Neural Information Processing Systems 34 (NeurIPS'21), 2021. [code]
Kazuto Fukuchi, Satoshi Hara, Takanori Maehara. Faking Fairness via Stealthily Biased Sampling. In Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI'20), pages 412--419, 2020. [code][slide][IEEE Spectrum]
Ulrich Aïvodji, Hiromi Arai, Olivier Fortineau, Sébastien Gambs, Satoshi Hara, Alain Tapp. Fairwashing: the risk of rationalization, In Proceedings of the 36th International Conference on Machine Learning (ICML'19), pages 161--170, 2019. [code][poster][slide&video][IEEE Spectrum]
高精度な機械学習モデルを構築するには、データサイエンティストや機械学習エンジニアの経験や直感、タスクの専門知識に基づく試行錯誤が欠かせません。しかし、熟練の機械学習のプロしか良いモデルを作れない、となると機械学習を広く様々なタスクへと応用することが難しくなってしまいます。本研究では、機械学習の使いやすさを向上して熟練のプロでなくとも良いモデルが作れるようにすることを目指しています。
【関連する研究成果】
Naoyuki Terashita, Hiroki Ohashi, Satoshi Hara. Data Cleansing for GANs. IEEE Transactions on Neural Networks and Learning Systems, 2025.
Hirofumi Suzuki, Hiroaki Iwashita, Takuya Takagi, Yuta Fujishige, Satoshi Hara. Rule Mining for Correcting Classification Models. In Proceedings of the 2023 IEEE International Conference on Data Mining (ICDM'23), pages 1331--1336, 2023.
Hirofumi Suzuki, Hiroaki Iwashita, Takuya Takagi, Keisuke Goto, Yuta Fujishige, Satoshi Hara. Explainable and Local Correction of Classification Models Using Decision Trees, In Proceedings of the 36th AAAI Conference on Artificial Intelligence (AAAI'22), pages 8404--8413, 2022.
Satoshi Hara, Atsuhi Nitanda, Takanori Maehara. Data Cleansing for Models Trained with SGD. Advances in Neural Information Processing Systems 32 (NeurIPS'19), 2019. [code][slide]
データからの知識発見はデータサイエンスにおいて欠かせない技術です。近年、統計や機械学習の様々なツールが公開され、誰でも手軽にデータサイエンスに取り組めるようになってきました。しかし、実はこれらのツールをただ闇雲に使っているだけでは、ときに重要な知識の見落としや、誤った知識の発見などの落とし穴にはまってしまいます。本研究ではこのようなデータサイエンスの落とし穴を解消するための新たなデータ分析技術の開発を行っています。
【関連する研究成果】
Satoshi Hara, Yuichi Yoshida. Average Sensitivity of Decision Tree Learning. The 11th International Conference on Learning Representations (ICLR'23), 2023. [code]
Satoshi Hara and Masakazu Ishihata. Approximate and Exact Enumeration of Rule Models. In Proceedings of the 32nd AAAI Conference on Artificial Intelligence (AAAI'18), pages 3157--3164, 2018. [poster]
Satoshi Hara and Takanori Maehara. Enumerate Lasso Solutions for Feature Selection. In Proceedings of the 31st AAAI Conference on Artificial Intelligence (AAAI'17), pages 1985--1991, 2017. [code][poster]
科学の進展に計測技術の発展は欠かせません。このためには計測装置のハードウェア的な発展だけでなくソフトウェア的な発展も必要です。計測インフォマティクスの目的は計測技術に特化した機械学習技術の開発です。計測インフォマティクスでは、計測装置の物理的な仕組みの知識を機械学習へと取り込むことを考えます。これにより通常の機械学習よりも高い精度での計測のソフトウェア的な補助(例えばノイズ除去)の実現を目指します。
【関連するプロジェクト】
JST ERATO 『竹内超量子もつれプロジェクト』
原研究室は理論グループの情報科学サブグループとして量子実験のための機械学習技術の研究に取り組んでいます。
【関連する研究成果】
Taichi Tomono, Satoshi Hara, Yusuke Nakai, Kazuma Takahara, Junko Iida, Takashi Washio, A Bayesian Approach for Component Estimation in Nucleic Acid Mixture Models. Frontiers in Analytical Science (Chemometrics), 3, 2023.
Satoshi Hara, Weichih Chen, Takashi Washio, Tetsuichi Wazawa, Takeharu Nagai. SPoD-Net: Fast Recovery of Microscopic Images Using Learned ISTA. In Proceedings of the 11th Asian Conference on Machine Learning (ACML'19), pages 694--709, 2019. [code]
Satoshi Hara, Takafumi Ono, Ryo Okamoto, Takashi Washio, and Shigeki Takeuchi. Quantum-State Anomaly Detection for Arbitrary Errors Using a Machine-Learning Technique. Physical Review A, 94(4):042341, 2016.