第8回勉強会

投稿日: 2017/05/08 10:51:58

日時 :2017年6月5日(月) 18:00ー (開場:17:30)

場所 :(株)ホットリンク 会議室 (飯田橋駅 徒歩6分)

東京都千代田区富士見1-3-11 富士見デュープレックスビズ5F

http://www.hottolink.co.jp/company/access

発表者:田然 (東北大学)

自然言語を論理的に理解するシステムを目指して

概要:

自然言語は、意味の類似度が測れる連続的な側面と、はっきりした記号的・論理的な側面を兼ね持つ。分散表現は前者のほうをうまく捉えているが、形式意味論は、言語に見られる現象を数学の概念として定式化することで、後者の論理構造を捉える。本講演では、ある形式意味論の一部の論理演算は分散表現のベクトル演算によって近似できることを示し、これを利用する自然言語の推論システムの構想について語る。

段取りとしては、まず今回扱う形式意味論を定式化し、その論理演算と分散表現のベクトル演算の類似性について説明する。次に分散表現の学習方法について説明し、最近行った改良も含めてデモをする。

そして、この分散表現を否定や量化も含めた一般的な論理推論に取り組むためのフレームワークについて紹介する。具体的には、「存在グラフ」という一階述語論理と同等な表現力を持つ論理系を紹介する。

最後に、反義語や矛盾するフレーズ、もっと一般的に「違うもの」についての学習を考えたい。間に合ったらこちらもデモする予定である。

余談ですが、自然言語文の含意・矛盾関係をアノテーションした大規模なデータセットが存在し、そこで訓練したニューラル・ネットによるend-to-endなシステムが高い精度を達成しているこの世の中で、きちんと形式意味論と論理系に沿って推論システムを構築するメリットがあるのか?、というのは当然の疑問かもしれません。これについて私のスタンスを予めここに書いておきましょう。

1. end-to-endなシステムでテスト精度が高いからと言って、「正しい一般化」を行っているとは限らない。逆に本講演で紹介するアプローチでは、言語現象を捉える構文解析器があり、その意味を扱う形式意味論があり、教師なしで学習できる分散表現でパラフレーズを吸収でき、言語資源から学習できる反義などの知識があれば、end-to-endな訓練データがなくても自然言語の推論システムを構築できる。訓練データ要らないことは実用上メリット大きいと考えている。

2. 含意・矛盾関係は自然言語の意味理解のほんの序の口に過ぎない。例えば、「髪曲を朝鮮族だけのものとするのは無理がある」なる文の意味は、「髪曲を結う全ての人が朝鮮族」という推論がとても成り立ちそうにない、ということを言っている!この例からわかるように、意味を完全に理解するためには、推論のプロセス自体を組み込む必要性もある。

3. 人間は自らの思考プロセスを内省でき、それは論理推論によるものである。人工知能も、いずれ「内省」できるものを作るべきだと私は思う。例えば、「間違った」と教えられたら、自分の推論過程をトラッキングし、一番「自分が間違った理解をした場所」になりそうなものを同定し、自らそれを修正するシステムである。

これらについての議論ももちろん歓迎します。