名古屋地区NLPセミナー

自然言語処理(Natural Language Processing)に関するインフォーマルなセミナーです。

どなたでも参加できます。申し込みは不要です。直接、会場にお越し下さい。

発表者も随時、募集しています。


次回の開催予定

第48回2017年11月7日(火曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

スピーカー:亀甲 博貴さん@東京大学

本年度の予定

第49回2017年11月21日(火曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

スピーカー:高村大也さん@東京工業大学

第50回2017年12月18日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

恒例の学生発表会+交流会@シェジロー(18:45-)

本年度の記録

第47回2017年7月3日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

自然言語を論理的に理解するシステムを目指して

田 然(東北大学)

自然言語は、意味の類似度が測れる連続的な側面と、はっきりした記号的・論理的な側面を兼ね持つ。分散表現は前者のほうをうまく捉えているが、形式意味論は、言語に見られる現象を数学の概念として定式化することで、後者の論理構造を捉える。本講演では、ある形式意味論の一部の論理演算は分散表現のベクトル演算によって近似できることを示し、これを利用する自然言語の推論システムの構想について語る。

段取りとしては、まず今回扱う形式意味論を定式化し、その論理演算と分散表現のベクトル演算の類似性について説明する。次に分散表現の学習方法について説明し、最近行った改良も含めてデモをする。 そして、この分散表現を否定や量化も含めた一般的な論理推論に取り組むためのフレームワークについて紹介する。具体的には、「存在グラフ」という一階述語論理と同等な表現力を持つ論理系を紹介する。 最後に、反義語や矛盾するフレーズ、もっと一般的に「違うもの」についての学習を考えたい。

参加者:44名

第46回2017年6月19日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

自然言語読解タスクの概観と分析

菅原朔(東京大学)

機械による言語理解をテストする枠組みとして読解タスクがある。タスクは文脈文とそれについての質問で構成され、照応解析や因果関係認識、常識推論など様々な能力を総合的に要求する。これまでいくつもデータセットが提案されているが、システムの開発において「このシステムは何が得意で、何が苦手か」といったように言語理解能力をつぶさに分析・評価するための方法論が整備されていないという課題がある。本発表では、読解タスクの既存のデータセット・システムを概観し、その分析手法について検討する。

参加者:40名

第45回2017年6月5日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

Sentencepiece : ニューラル言語処理向けトークナイザ

工藤拓 (Google)

ニューラル機械翻訳のアーキテクチャは従来法と大きく異なるとはいえ、入出力は慣習的に単語列が使われることが多い。 しかし、単純に単語列を用いると処理速度の低下や未知語の増加といった実用上の問題が生じる。ニューラル言語生成にはそれに即した単語分割が必要であろうという考えのもと、新しいトークナイザ Sentencepiece を開発・公開している。Sentencepeice は、サブワードの一般化であり、生文から教師無しで分割を学習することで完全なEnd-to-End 処理を可能にしている。本発表は、Sentencepieceの概要と機械翻訳における実験結果を紹介するとともに、ニューラル言語処理向けのトークナイザのあるべき姿について議論したい。

参加者:44名

第44回2017年5月22日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

ニューラル機械翻訳の仕組み

中澤 敏明(JST)

ニューラル機械翻訳(NMT)の登場により機械翻訳のパラダイムは大きく変化した。平均的な翻訳精度は統計翻訳(SMT)と比較すると格段に向上したが、誤りの傾向がSMTとは大きく異なっており、NMT特有の誤りも存在する。本発表ではSMTの簡単な復習とNMTを理解する上で必要なニューラルネットワークの知識を説明した後、SMTと比較しながらNMTの仕組みを解説する。またそれぞれの翻訳結果の特徴を明らかにし、最近のNMTの研究についても触れる。

参加者:37名

第43回2017年5月8日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

大規模コーパスに基づく基本語順の分析

笹野遼平(名古屋大学大学院情報学研究科価値創造研究センター)

日本語二重目的語構文の基本語順に関しては、種々の理論研究に加え、心理実験や脳波計測に基づく多くの実証的研究が行われている。しかし、これらの手法は分析対象とした用例については高い信頼度で分析できるものの、仮説の網羅的な検証には不向きであると考えられる。本発表では、100億文を越える大規模コーパスを用いた日本語二重目的語構文の基本語順の分析について紹介する。また、今後の研究の方向性についても触れる。

参加者:47名


名古屋地区NLPセミナー

代表世話人:佐藤理史(名古屋大学)、佐々木裕(豊田工業大学)

問い合わせ先: ssato (*) nuee.nagoya-u.ac.jp    (*=@)