2012

2012年度の開催記録

第19回 2012年12月19日 17:15-18:45@名古屋大学工学部IB電子情報館013教室

学生による研究紹介

    1. 佐々木研究室

        • 小堀脩豊(M2)

        • 大場弘樹(M1)

        • 小野正貴(M1)

    2. 外山研究室

        • Agro Rachmatullah (M2)

        • 稲木 大 (M1)

    3. 佐藤・駒谷研究室

        • 大塚 嗣巳 (B4)

        • 川口 人士 (B4)

        • 服部 昇平 (B4)

        • 服部 真之 (B4)

        • 堀田 尚希 (B4)

        • 岩崎 裕也 (M2)

        • 松木 久幸 (M2)

        • 森 祥二郎 (M2)

        • 中島 大一 (M2)

参加者:34名

第18回 2012年11月28日 17:15-18:45@名古屋大学工学部IB電子情報館015教室

日本語コーパスの50年

丸山岳彦(国立国語研究所)

日本語コーパスの開発と利用の歴史は、50年以上も前にまで遡ることができる。 1948年に設立された国立国語研究所による初期の仕事を紐解いてみると、世界 的に見ても極めて早い時期からコーパスを構築し、質の高い言語分析に役立て ていたことが分かる。今回のトークでは、日本語コーパスの50年を振り返る形 で、どのような目的によってどのようなコーパスが作られ、どのように使われ てきたかを見渡してみることにしたい。また、その系譜の最先端に位置づけら れる『日本語話し言葉コーパス(CSJ)』(2004年公開)、および『現代日本語 書き言葉均衡コーパス(BCCWJ)』(2011年公開)の設計方針と構築過程、アノ テーション等について紹介する。

参加者:22名

第17回 2012年10月31日 17:15-18:45@名古屋大学工学部IB電子情報館014教室

実世界にグラウンドした人-ロボット対話

杉浦孔明 (NICT)

我々は、実世界にグラウンドした対話処理機構を持つロボットを実現するため に、音声対話を通じて実世界知識を学習する計算機構LCoreを開発している。 LCoreは、音声・画像・動作・コンテキスト情報を用いてユーザの発話を解釈す る枠組みであり、各モジュールはリアルタイムかつインタラクティブに学習可能 である。本発表では、マルチモーダル言語処理の課題を議論し、ショッピング モールなどの日常環境における生活支援ロボットへのLCoreの応用について紹介 する。

参加者:24名

第16回 2012年9月26日 17:15-18:45@名古屋大学工学部IB電子情報館014教室

1. 英語学習者コーパスを用いた英作文の誤り訂正

小町守(奈良先端大)

我々は第二言語学習・教育に自然言語処理技術を応用する研究を行なっている。 英語学習者の作文には、様々な誤りが含まれているが、近年になるまで大規模に 誤りをタグ付けしたコーパスが公開されていなかった。そこで我々はウェブから 大規模な学習者コーパスを作成する手法を提案し、誤り訂正タスクで作成した大 規模コーパスの性能を比較した。また、文法誤り訂正には品詞や統語情報といっ た言語知識が必要となるが、学習者の作文はさまざまな誤りを含むため、品詞付 与や構文解析が困難であるという問題がある。そのため、我々はスペリング訂正 と品詞付与を同時解析することで、品詞の系列を考慮しながらスペリング訂正を 行ない、品詞付与の性能を向上させる手法を提案する。本発表では、我々が現在 取り組んでいる以下の研究について紹介する。

(1) ウェブからの大規模英語学習者コーパスの構築

(2) 大域的文脈情報を用いた英語時制誤りの検出と訂正

(3) 英語学習者のスペリング訂正と品詞タグ付けの同時解析

2. 読点の用法的分類に基づく日本語テキストへの自動読点挿入

村田匡輝(名大)

概要:本発表では,統計的アプローチにより日本語テキストに読点を自動挿入す る手法を提案する.読点の自動挿入は,音声筆記や機械翻訳などの文生成処理, また,日本語の非母語話者のための作文支援の要素技術として利用できる.日本 語の読点にはいくつかの用法が存在し,その用法ごとに文中での挿入位置が異な る.本研究では,読点の用法を分類し,用法ごとの読点の出現傾向を分析するこ とにより,読点挿入に用いる素性を決定した.各用法を特徴付ける要素を素性と して導入することにより,読点を精度よく挿入できる.本手法では,特定の形態 素の存在や節境界の種類,また,文字の種類,読点間の文字列の長さなどを素性 とする統計的手法によって読点の挿入位置を同定する.テキストコーパスを使用 した読点挿入実験により,本手法の有効性を確認した.

参加者:28名

第15回 2012年6月27日 17:15-18:45@名古屋大学工学部IB電子情報館014教室

スピーカー:笹野遼平(東工大)、中村誠(名大)

1. 大規模語彙的知識に基づく受身形と能動形の表層格の対応関係知識の自動獲得

笹野遼平(東工大)

テキスト中に出現した述語の格構造を認識する処理は格解析などと呼ばれ,計算機によるテキスト理解のための重要な1ステップであると言える.しかし,一口に"格"と言っても,出現形に対する表層格や原形に対する表層格,さらには深層格など複数の表現レベルが考えられる.各表現レベルにおける格構造の間には密接な関係が存在するものの,その対応関係は用言ごと,用法ごとに異なっており,これらの関係を高精度に認識するためには,用言・用法ごとに構築された格の対応関係に関する知識が不可欠となる.本発表では受身形で出現した述語の出現形格構造と原形格構造の対応関係に焦点を当て,大規模語彙的知識と受身形と能動形の格の対応パターンを組み合わせることで,受身形と能動形の表層格の対応関係に関する知識を自動獲得する試みを紹介する.また,獲得した知識を受身文から能動文へ変換における格助詞の変換タスクに適用することにより,その有用性を示す.

2. 言語進化論的手法によるクレオール化のシミュレーション

中村誠(名大)

言語進化もしくは進化言語学とは、人間の言語の起源と進化について問う研究領域である。その関連領域は、人間の理解に関わる多岐の分野に渡り、計算機シミュレーションや数学的なモデリングを用いた研究もそのうちのひとつである。言語進化に関わる言語現象のひとつとして、クレオール化があげられる。クレオール化とは、集団間における言語接触によって、それまでの言語とは文法的に異なる新言語が誕生する現象をいう。このような現象は世界中で発見されており、それぞれが独自に発達した言語体系であるにもかかわらず、非常に似通った特徴と文法構造を持っていると言われている。我々の研究の目的は、クレオール化が起こるための言語獲得能力と社会・言語環境についての条件をシミュレーションによって導出し、言語変化の過程を通時的な側面から一般化された形で定式化することである。発表では、進化言語学の計算機シミュレーション研究に関するこれまでの成果を踏まえ、今後の展開を議論する。

参加者:27名

第14回 2012年5月30日 17:15-18:45@名古屋大学工学部IB電子情報館015教室

「魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent」

李晃伸(名古屋工業大学)

我々は音声インタフェース・音声対話システム等の音声によるインタラクションが持つ 他のモードにない固有の「魅力」の解明を目指しており、それを解明・実証するための統合的なプラットフォームとしてオープンソースのツールキット MMDAgent を開発した。 MMDAgent はJulius, OpenJTalk などの最先端の音声技術が統合され、さらに音声処理と密統合された表示・対話管理機能と十分な3Dモデルレンダリング性能を持ち他のツールと連動して自由に音声インタラクションシステムを構築することが可能である。本発表ではMMDAgentの狙いと開発の経緯等について紹介を行う。

参加者:22名

第13回 2012年4月25日(水)17:15-18:45 @ 名古屋大学工学部 IB電子情報館IB014教室

1. 自動獲得知識に基づく頑健な実テキスト解析

河原大輔(京都大学)

Webの発展、およびそれに伴うブログ、SNSなどの一次情報源の爆発的増加によっ て、新語、口語表現、非正規表現、顔文字など、さまざまな言語表現バリエー ションがテキスト中に溢れている。これらの言語表現バリエーションを頑健に 処理するには、それらに関する知識を用意する必要がある。我々は、Webおよび Wikipediaから、新語や固有名詞を含む辞書を自動的に獲得し、この辞書を用い た形態素解析システムを開発している。また、Web70億文から自動獲得した格フ レーム辞書に基づく統計的な構文・格解析システムを開発しており、係り受け・ 格関係を高精度に解析することができる。本発表では、これらの知識の自動獲 得とそれに基づく解析システムについて紹介し、今後の方向性について議論する。

2. 「試験問題に解答する」ことから見える自然言語処理の課題

宮尾祐介(NII)

「人工頭脳プロジェクト—ロボットは東大に入れるか」について概説し,試験 問題を言語処理研究におけるベンチマークとすることの意義と展望について議 論する.実際の大学入試問題の分析を通して,自然言語で記述された問題を理 解し解答するために必要となる技術と現在の言語処理技術とのギャップに焦点 を当てる.

参加者:27名

名古屋地区NLPセミナー

代表世話人:佐藤理史(名古屋大学)、佐々木裕(豊田工業大学)

問い合わせ先: ssato (*) nuee.nagoya-u.ac.jp (*=@)