ニュース

最新のお知らせ

  • 第46回名古屋地区NLPセミナー 自然言語読解タスクの概観と分析菅原朔(東京大学)機械による言語理解をテストする枠組みとして読解タスクがある。タスクは文脈文とそれについての質問で構成され、照応解析や因果関係認識、常識推論など様々な能力を総合的に要求する。これまでいくつもデータセットが提案されているが、システムの開発において「このシステムは何が得意で、何が苦手か」といったように言語理解能力をつぶさに分析・評価するための方法論が整備されていないという課題がある。本発表では、読解タスクの既存のデータセット・システムを概観し、その分析手法について検討する。
    投稿: 2017/06/19 2:36、ryo kimura
  • 第45回名古屋地区NLPセミナー Sentencepiece : ニューラル言語処理向けトークナイザ工藤拓 (Google)ニューラル機械翻訳のアーキテクチャは従来法と大きく異なるとはいえ、入出力は慣習的に単語列が使われることが多い。 しかし、単純に単語列を用いると処理速度の低下や未知語の増加といった実用上の問題が生じる。ニューラル言語生成にはそれに即した単語分割が必要であろうという考えのもと、新しいトークナイザ Sentencepieceを開発・公開している。Sentencepeiceは、サブワードの一般化であり、生文から教師無しで分割を学習することで完全なEnd-to-End 処理を可能にしている。本発表は、Sentencepieceの概要と機械翻訳における実験結果を紹介するとともに ...
    投稿: 2017/06/05 2:42、ryo kimura
  • 第44回名古屋地区NLPセミナー ニューラル機械翻訳の仕組み中澤 敏明(JST)ニューラル機械翻訳(NMT)の登場により機械翻訳のパラダイムは大きく変化した。平均的な翻訳精度は統計翻訳(SMT)と比較すると格段に向上したが、誤りの傾向がSMTとは大きく異なっており、NMT特有の誤りも存在する。本発表ではSMTの簡単な復習とNMTを理解する上で必要なニューラルネットワークの知識を説明した後、SMTと比較しながらNMTの仕組みを解説する。またそれぞれの翻訳結果の特徴を明らかにし、最近のNMTの研究についても触れる。
    投稿: 2017/05/22 17:16、ryo kimura
  • 第43回名古屋地区NLPセミナー 大規模コーパスに基づく基本語順の分析笹野遼平(名古屋大学大学院情報学研究科価値創造研究センター)日本語二重目的語構文の基本語順に関しては、種々の理論研究に加え、心理実験や脳波計測に基づく多くの実証的研究が行われている。しかし、これらの手法は分析対象とした用例については高い信頼度で分析できるものの、仮説の網羅的な検証には不向きであると考えられる。本発表では、100億文を越える大規模コーパスを用いた日本語二重目的語構文の基本語順の分析について紹介する。また、今後の研究の方向性についても触れる。
    投稿: 2017/05/08 2:45、ryo kimura
  • 第42回名古屋地区NLPセミナー 学生発表会 佐々木研:9名外山研:5名松原G:3名佐藤・松崎研:10名
    投稿: 2017/01/16 21:35、松山諒平
1 - 5 / 11 件の投稿を表示中 もっと見る »

第46回名古屋地区NLPセミナー

2017/06/19 2:36 に ryo kimura が投稿

自然言語読解タスクの概観と分析

菅原朔(東京大学)

機械による言語理解をテストする枠組みとして読解タスクがある。タスクは文脈文とそれについての質問で構成され、照応解析や因果関係認識、常識推論など様々な能力を総合的に要求する。これまでいくつもデータセットが提案されているが、システムの開発において「このシステムは何が得意で、何が苦手か」といったように言語理解能力をつぶさに分析・評価するための方法論が整備されていないという課題がある。本発表では、読解タスクの既存のデータセット・システムを概観し、その分析手法について検討する。


第45回名古屋地区NLPセミナー

2017/06/05 2:42 に ryo kimura が投稿

Sentencepiece : ニューラル言語処理向けトークナイザ

工藤拓 (Google)

ニューラル機械翻訳のアーキテクチャは従来法と大きく異なるとはいえ、入出力は慣習的に単語列が使われることが多い。 しかし、単純に単語列を用いると処理速度の低下や未知語の増加といった実用上の問題が生じる。ニューラル言語生成にはそれに即した単語分割が必要であろうという考えのもと、新しいトークナイザ Sentencepieceを開発・公開している。Sentencepeiceは、サブワードの一般化であり、生文から教師無しで分割を学習することで完全なEnd-to-End 処理を可能にしている。本発表は、Sentencepieceの概要と機械翻訳における実験結果を紹介するとともに、ニューラル言語処理向けのトークナイザのあるべき姿について議論したい。


第44回名古屋地区NLPセミナー

2017/05/22 17:16 に ryo kimura が投稿

ニューラル機械翻訳の仕組み

中澤 敏明(JST)

ニューラル機械翻訳(NMT)の登場により機械翻訳のパラダイムは大きく変化した。平均的な翻訳精度は統計翻訳(SMT)と比較すると格段に向上したが、誤りの傾向がSMTとは大きく異なっており、NMT特有の誤りも存在する。本発表ではSMTの簡単な復習とNMTを理解する上で必要なニューラルネットワークの知識を説明した後、SMTと比較しながらNMTの仕組みを解説する。またそれぞれの翻訳結果の特徴を明らかにし、最近のNMTの研究についても触れる。


第43回名古屋地区NLPセミナー

2017/05/08 2:45 に ryo kimura が投稿

大規模コーパスに基づく基本語順の分析

笹野遼平(名古屋大学大学院情報学研究科価値創造研究センター)

日本語二重目的語構文の基本語順に関しては、種々の理論研究に加え、心理実験や脳波計測に基づく多くの実証的研究が行われている。しかし、これらの手法は分析対象とした用例については高い信頼度で分析できるものの、仮説の網羅的な検証には不向きであると考えられる。本発表では、100億文を越える大規模コーパスを用いた日本語二重目的語構文の基本語順の分析について紹介する。また、今後の研究の方向性についても触れる。


第42回名古屋地区NLPセミナー

2017/01/16 21:34 に 松山諒平 が投稿   [ 2017/01/16 21:35 に更新しました ]

学生発表会 

  • 佐々木研:9名
  • 外山研:5名
  • 松原G:3名
  • 佐藤・松崎研:10名

第41回名古屋地区NLPセミナー

2016/12/08 16:38 に 豊辻宏旨 が投稿

制限オーサリングと機械翻訳

宮田 玲(東京大学大学院教育学研究科)

原文の言語表現をコントロールすることで機械翻訳を実用的に活用する手法として、制限言語(Controlled Language)や前編集(Pre-edit)の研究が進められてきた。しかし、これまでの研究はセンテンスレベルの議論にとどまりがちであり、言語構造に加えて文書内の言語形式の慣例にも違いがある日英などの言語間のさらなる翻訳改善のためには、より「上位」の文書構成要素に目を向ける必要がある。本講演では、「文書構造」という概念を導入した上で、文書を構成するテキストの機能的位置づけや伝達目標を明示的に考慮しながら、機械翻訳をより高度に活用するための枠組みを紹介する。また現在開発中である自治体文書を対象とした制限オーサリングシステムのデモも行う。


2016/10/25 第40回名古屋地区NLPセミナー

2016/10/25 18:22 に takumi itou が投稿

左隅型解析に基づく非局所的依存関係の同定

加藤芳秀(名古屋大学情報連携統括本部情報戦略室)

非局所的依存関係は,構成素の移動やゼロ代名詞の照応関係などの統語的な現象を表現する.非局所的依存関係の同定は,自然言語処理における重要なタスクの一つである. 本発表では,我々が提案した左隅型解析に基づく非局所的依存関係同定手法を紹介する. 非局所的依存関係の同定において,構文木のノード間の関係であるc統御が重要な役割を果たすが,左隅型解析によりこの関係を容易に捉えることができる. 本手法では,c統御を用いた規則により非局所的依存関係を同定する.


オープンキャンパス2016

2016/08/07 23:53 に 松山諒平 が投稿   [ 2016/08/08 0:24 に更新しました ]

2016年度オープンキャンパスを行いました。暑い中お越しいただきありがとうございました。 




第39回 名古屋地区NLPセミナー

2016/06/08 1:13 に 豊辻宏旨 が投稿   [ 2016/06/08 1:16 に更新しました ]

西川仁@東工大

機械による文章の自動的な要約が構想されてからおよそ60年が経過した.自動要約器の構成方式はほぼ確立されたと見てよい.大規模な言語資源と計算資源の投下,要素技術の高度化により,早晩,特定の領域においては高度な自動要約が広く一般に利用されることになるだろうが,一方で,様々な形態の,様々な性質を備えた文章を,読み手に合わせて柔軟に扱うことは,当面,難しそうである.本講演では,自動要約の基本的な概念をまず説明し,現在の自動要約器の実現方式について解説するとともに,今後の研究開発の方向性,また現在の自動要約が直面している課題についても述べる.


2016/04/26 第38回名古屋地区NLPセミナー

2016/05/11 23:16 に 松山諒平 が投稿

構文情報を利用したニューラルネットワークによる自然言語処理

橋本 和真、江里口 瑛子@東京大学

自然言語処理において単語のembeddingやニューラルネットワークに基づく文の意味表現の有用性が様々なタスクで示されている. 本発表では, まずその概要について簡単にまとめ, 構文情報を利用する立場として「句のembeddingの学習」と「ニューラルネット機械翻訳」に関して実際の研究を紹介する.


1-10 of 11