投稿日: 2016/05/18 22:51:30
日時 :6/15(水) 17:00〜
場所 :(株)PFI 会議室A (大手町ビル2F、千代田区大手町1-6-1)
発表者 :宮澤彬 (NII/総研大 M2)
タイトル:自然言語処理でメタファーをどう扱うか —いくつかのモデルとデータの紹介—
概要 :一般的にメタファーは装飾的,あるいは付加的なものと捉えられがちであるが,
新たな語義の生成や抽象的な概念の理解など重要な役割を果たしている.
しかし自然言語処理においては,他のタスクと比べると盛んに研究されているとは言いがたい.
そこで本発表では,自然言語処理におけるメタファーの扱いについて概説する.
まずはメタファーとはどういうものかを説明する.
次にメタファーの理解のモデルとして顕現性の理論を紹介する.
その後,概念写像のモデルとそれをメタファーの検出・理解のシステムに応用した Shutova et al. (2013) の内容を紹介する.
最後に今後,自然言語処理においてメタファーの研究が盛んになってくるにつれ,
ますます重要になってくるであろうデータの作成方法について述べる.
https://speakerdeck.com/pecorarista/zi-ran-yan-yu-chu-li-demetahuawodouxi-uka
発表者 :熊谷香織 (お茶大 M2)
タイトル:モンテカルロ木探索を用いた統語情報を考慮した文生成
概要 :近年、視覚などの非言語情報から言語を生成する研究が盛んに研究されている。
それらの多くがnグラム言語モデルやニューラル言語モデルに基づくものが大勢を占めており、
統語情報を考慮したものは数少ない。
一方で、テンプレートを用いた文生成手法も存在するが、表現や言い回しが固定化されてしまう。
本研究では、モンテカルロ木探索において文脈自由文法を作用素として用いた構文木形成により
統語構造を考慮した文生成手法を提案する。
具体的には、モンテカルロ木探索によるシミュレーションを通じて適切な構文木を探索し、
さらには多様な単語や表現を伴った文を生成する。
また、シミュレーションにより生成された文に対する評価においては、 構造的な視点と
単語の繋がりに対する視点との2つの側面から評価を行い、
統語的にも単語の系列的にも妥当となる文の生成を目指す。
発表者 :持橋大地 (統数研)
タイトル:CRFとNPYLMの統合による半教師あり形態素解析 (完全版)
概要 :正書的な新聞コーパス等に現れない新語や新しい表現を多数含むTwitterや
ブログなどの単語分割は需要が高く, 特に今後重要となる会話の扱いにおいても重要
だと考えられる。しかし, 辞書による人手の対応にはカバー率やコストの設定に限界が
あり, また言語資源がそれほど豊富でない言語の場合も考えると, 教師なし学習を援用して
自動的に解析を行えることがより望ましい。
こうした実用的な解析のためには教師ありデータでの規則を守りつつ, 教師なし学習と
統合する半教師あり学習が必要となる。本発表ではこのための持橋+(2011)の研究を修正し,
正しい学習を可能にした藤井&持橋(2016)の研究について紹介する。中国語および
日本語の標準的コーパスおよびTwitter, ブログの文章で実験を行った。
本研究は(株)博報堂 研究開発局との共同研究です。
発表スライド: http://chasen.org/~daiti-m/paper/TokyoCL2016npycrf.pdf