第57回名古屋地区NLPセミナー

投稿日: 2019/05/31 7:59:09

文解析における既存データセットの制約とそれを超える解析手法

栗田修平 (理研AIP)

自然言語処理における構文・意味解析のような文解析手法は、人手で作成されたラベル付きコーパスからの学習に頼っている。このようなデータセットでは、一つ一つの自然言語文に対してかなり詳細な情報を付与している一方で、作成には膨大なコストがかかりデータサイズを大きく増やすことは難しい。しかし、自然言語文のより高度な解析のためには、本質的により大規模なデータセットから情報や知識を取得する必要があると考えられる。本発表では、既存データセットから単一タスクの教師あり学習という枠組みに縛られない研究として、深層学習を用いた統合構文解析器、大規模コーパスからの述語項構造の知識の獲得と解析への応用、強化学習を用いた文の解析順序の自己決定手法を紹介し、今後のNLP/NLU研究の方向性について考える。

参加者: 47名