2017

2017度の記録

第50回2017年12月18日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

恒例の学生発表会+交流会@シェジロー(18:45-)

佐々木研:7名

外山研:5名

松原研:1名

佐藤・松崎研:8名

計:21名

参加者:42名

交流会:36名

第49回2017年11月21日(火曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

データを説明するテキストの生成

高村大也(産総研人工知能研究センター)

センサの普及やストレージの拡充により、金融データ、生理指標データ、人間の行動データなどを含む様々なデータが、数値データ、カテゴリカルデータ、テキストデータなど様々な形式で大量に蓄積されている。しかし、こういったデータが何を意味しているかを知るためには、人間が解釈する必要がある。さらにデータの解釈を他の人間に伝えるためには言語表現(テキスト)という形で説明する必要がある。これをコンピュータにより自動的に行うことができるようにすることで、蓄積されたデータが有効利用できるようになる。本発表ではこのための技術を概観し、いくつかの研究例を紹介する。

参加者:40名

第48回2017年11月7日(火曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

人間とコンピュータの思考の対応付けに基づく将棋解説文生成

亀甲 博貴(東京大学)

非言語情報を自然言語に変換する研究は数多く行われているが,本発表ではそのうちの一つである将棋解説文の自動生成の取り組みを紹介する. 将棋解説文の特徴として,ゲーム木と呼ばれる状態の遷移を表現するグラフに基づいていることが挙げられる. ゲーム木と人間のエキスパートによる解説文との対応付け手法と,それに基づく解説文生成手法について述べる.

参加者:35名

第47回2017年7月3日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

自然言語を論理的に理解するシステムを目指して

田 然(東北大学)

自然言語は、意味の類似度が測れる連続的な側面と、はっきりした記号的・論理的な側面を兼ね持つ。分散表現は前者のほうをうまく捉えているが、形式意味論は、言語に見られる現象を数学の概念として定式化することで、後者の論理構造を捉える。本講演では、ある形式意味論の一部の論理演算は分散表現のベクトル演算によって近似できることを示し、これを利用する自然言語の推論システムの構想について語る。

段取りとしては、まず今回扱う形式意味論を定式化し、その論理演算と分散表現のベクトル演算の類似性について説明する。次に分散表現の学習方法について説明し、最近行った改良も含めてデモをする。 そして、この分散表現を否定や量化も含めた一般的な論理推論に取り組むためのフレームワークについて紹介する。具体的には、「存在グラフ」という一階述語論理と同等な表現力を持つ論理系を紹介する。 最後に、反義語や矛盾するフレーズ、もっと一般的に「違うもの」についての学習を考えたい。

参加者:44名

第46回2017年6月19日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

自然言語読解タスクの概観と分析

菅原朔(東京大学)

機械による言語理解をテストする枠組みとして読解タスクがある。タスクは文脈文とそれについての質問で構成され、照応解析や因果関係認識、常識推論など様々な能力を総合的に要求する。これまでいくつもデータセットが提案されているが、システムの開発において「このシステムは何が得意で、何が苦手か」といったように言語理解能力をつぶさに分析・評価するための方法論が整備されていないという課題がある。本発表では、読解タスクの既存のデータセット・システムを概観し、その分析手法について検討する。

参加者:40名

第45回2017年6月5日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

Sentencepiece : ニューラル言語処理向けトークナイザ

工藤拓 (Google)

ニューラル機械翻訳のアーキテクチャは従来法と大きく異なるとはいえ、入出力は慣習的に単語列が使われることが多い。 しかし、単純に単語列を用いると処理速度の低下や未知語の増加といった実用上の問題が生じる。ニューラル言語生成にはそれに即した単語分割が必要であろうという考えのもと、新しいトークナイザ Sentencepiece を開発・公開している。Sentencepeice は、サブワードの一般化であり、生文から教師無しで分割を学習することで完全なEnd-to-End 処理を可能にしている。本発表は、Sentencepieceの概要と機械翻訳における実験結果を紹介するとともに、ニューラル言語処理向けのトークナイザのあるべき姿について議論したい。

参加者:44名

第44回2017年5月22日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

ニューラル機械翻訳の仕組み

中澤 敏明(JST)

ニューラル機械翻訳(NMT)の登場により機械翻訳のパラダイムは大きく変化した。平均的な翻訳精度は統計翻訳(SMT)と比較すると格段に向上したが、誤りの傾向がSMTとは大きく異なっており、NMT特有の誤りも存在する。本発表ではSMTの簡単な復習とNMTを理解する上で必要なニューラルネットワークの知識を説明した後、SMTと比較しながらNMTの仕組みを解説する。またそれぞれの翻訳結果の特徴を明らかにし、最近のNMTの研究についても触れる。

参加者:37名

第43回2017年5月8日(月曜日)17:00-18:30@名古屋大学工学部IB電子情報館中棟IB014教室

大規模コーパスに基づく基本語順の分析

笹野遼平(名古屋大学大学院情報学研究科価値創造研究センター)

日本語二重目的語構文の基本語順に関しては、種々の理論研究に加え、心理実験や脳波計測に基づく多くの実証的研究が行われている。しかし、これらの手法は分析対象とした用例については高い信頼度で分析できるものの、仮説の網羅的な検証には不向きであると考えられる。本発表では、100億文を越える大規模コーパスを用いた日本語二重目的語構文の基本語順の分析について紹介する。また、今後の研究の方向性についても触れる。

参加者:47名