2010

第6回 2010年12月22日(水) 17:15-18:45 @ 名古屋大学IB電子情報館IB-012教室

鶴岡慶雅（北陸先端大）

1. 解析アクションの先読みに基づく高速・高精度な自然言語文解析

本研究では、基盤的な自然言語処理技術である、品詞タグ付け、固有表現認識、構文解析など、構造予測問題と呼ばれるタスクに対する新しい機械学習アプローチを提案する。提案手法は、解析アクションの履歴に基づくアプローチをベースとしているが、従来手法と異なり、解析アクションの先読み機構が学習モデルに統合されている。提案手法では、現時点で可能なそれぞれの解析アクションに対して先読みを行い、その後の解析アクションの系列によって達成される解析結果をもとに現時点での最適なアクションを選択する。このことにより、非局所的に整合的でない部分解析結果を排除することができ、高い精度での解析が可能になっている。

2. コンピュータ将棋の最前線

2010年秋、情報処理学会から将棋連盟への「挑戦状」をうけて行われた公開対局において、コンピュータは清水市代女流王将に勝利した。いまやコンピュータ将棋の実力は、プロ棋士のレベルに到達しつつあるといわれる。本講演では、将棋プログラム「激指」の開発に関する話を中心に、コンピュータ将棋、およびゲーム研究の現況について紹介する。特に、近年のコンピュータ将棋の棋力向上の原動力となった、機械学習による探索範囲制御、および評価関数の自動学習手法について詳細に述べる。

参加者：29名

第5回 2010年11月24日(水) 17:15-18:45 @ 名古屋大学IB電子情報館IB-012教室

1. Twitter要約のための数理モデル

高村大也（東京工業大学）

Twitterなどのマイクロブログにおいては、スポーツ中継あるいはテレビ番組放映中などに、それらに関するエントリが大量にポストされる。これらの大量のエントリから、何が起こっているのか、ユーザはどのような意見を持っているのか、などについての要約を生成するという研究課題を考え、これをエントリ選択という形で実現する。通常の文書要約問題で用いられる新聞記事などと比べると、マイクロブログは、エントリ数が膨大であることと、各エントリが時間軸上に整列しているという特徴を持つ。我々は、既存の施設配置文書要約モデルを、これらの特徴を考慮したモデルに拡張する。実験においては、スポーツの試合に関するエントリ集合の要約を行う。

2. グラフカーネルに基づく非分かち書き文からの漸次的語彙知識獲得

萩原正人（楽天技術研究所）

固有名詞やそれらの間の関係は自然言語処理において重要な知識源である。これまで、Espresso アルゴリズムや Tchaiアルゴリズムなど、ブートストラップに基づき大規模コーパス等から漸次的に語彙知識を抽出する手法がいくつか提案されている。しかし、これらの手法は、英語等の分かち書きされた文や、クエリログなど文脈を明確に定義できる言語資源のみを対象にしている。本発表では、日本語の非分かち書き文であっても固有名詞カテゴリを直接抽出できるアルゴリズム g-Monaka を提案する。本手法は、文字 nグラムの隣接関係を有向グラフにより表現し、グラフカーネルを適用することにより、意味ドリフト等の問題を回避し、高精度な語彙知識抽出を可能にする。本発表では、g-Monakaアルゴリズムを用いて意味カテゴリを抽出した実験結果を報告し、Web を用いた実用スケールの応用事例を紹介する。

参加者：35名

第４回 2010年10月27日(水) 17:15-18:45 @ 名古屋大学IB電子情報館IB-012教室

１．人間同士の対話現象を組み入れた音声対話システムの研究

西村良太（豊橋技術科学大学）

人間と機械が音声対話によってやりとりを行う場合に，これまでの音声対話システムでは，人間同士の対話のように自然な対話を行うことは不可能である．人間と機械が対話を行う際に，機械が人間同士の会話と同じように，相手に同調を示すことができれば，より円滑な対話を行うことが期待できる．この為にまず，実際の人間同士の対話コーパスにて，人間同士の対話の印象と韻律変化との間にどのような関係性があるのかを分析し，モデルを構築した．このモデルを音声対話システムに実装することによって，人間同士の対話現象を模倣して応答することが可能な音声対話システムを構築した．被験者実験の結果から，オーバーラップを含む通常応答やあいづちに対して高い自然性が示され，被験者の多くがあいづちに対して親しみを感じた．

２．同期文法を用いた構文木コーパスの誤り訂正

加藤芳秀（名古屋大学）

本発表では，構文木コーパスに含まれる誤りを自動訂正する手法を提案する．従来の自動誤り訂正手法は，コーパス中のタグを別のタグに置き換える単純な誤り訂正しか実現していない．これに対して，本発表で提案する手法では，同期文法の一種である synchronous tree substitution grammar を用いることにより，構造的な変換を伴う誤り訂正を実現する．構文木コーパスにおいてはタグが階層的な構造をもつため，構造的な変換を伴う誤り訂正が必要になるが，本手法はこれを可能にする．Penn Treebank を用いた誤り訂正実験により本手法を評価したのでそれについて報告する．

参加者：40名

第３回 2010年9月22日(水) 17:15-18:45 @ 名古屋大学工学部7号館 704号室

１．点予測による言語処理

森信介（京都大学）

実用に耐える言語処理を実現するためには、様々な分野のテキストに対して高い精度の言語処理を短期間かつ安価に実現する必要がある。現在主流となっているコーパスに基づく言語処理の大半の手法は、文の全ての部分に情報が付与されたフルアノテーションコーパスを前提とする。これに対し、本発表では、コーパスを部分的にアノテーションすることと、その利点を活かす点予測による言語処理を提案する。さらに、『現代日本語書き言葉均衡コーパス』を用いた実験の結果を提示し提案する枠組みの評価を行う。最後に、コーパスへの部分的アノテーションと点予測による言語処理の今後を展望する。

2. エッセイコーパスを用いた日本語テキストの著者推定

石田将吾（名古屋大学）

本発表では，新たに編纂したエッセイコーパスを用いた著者推定実験の結果について報告する．このエッセイコーパスは，30 人の職業作家の 90 冊のエッセイ集から抽出したテキストから構成されており，1 人当たり約 3 万字（約 1,000 字 ×10ヶ所 ×3 冊）を収録している．文字 bigram 言語モデルを利用した著者推定法の精度は，5,000 字の推定用テキストを用いた場合，97.8%であった．また，推定用テキストとして， 1ヶ所から抽出した 1,000 字を用いた場合は 74.4%， 5ヶ所から抽出した 200 字を併合した 1,000 字を使った場合は 84.9%と，推定精度が 10 ポイント以上異なることが明らかになった． (情報処理学会自然言語処理研究会(9月17日)発表予定と同内容)

参加者: 32名

第２回 2010年8月4日(水) 17:15-18:45 @名古屋大学工学部7号館 703号室

1. ユーザのための統合自然言語処理システムU-Compare

狩野芳伸（東京大学）

自然言語処理技術の発展とともに，数多くの言語資源（コーパス・ツール）が一般に利用可能な形で公開されている．しかし，多くの場合互換性が考慮されておらず，言語資源を組み合わせるためにはデータ形式の変換や実行設定記述などユーザにとって本質的でない作業が必要であった．本発表ではまず，このような状況を改善するオープンフレームワークであるUIMAと，NLPコミュニティにおけるUIMA関連のプロジェクトや応用を紹介する．そのうえで，UIMAのみでは不足していた，より高度な互換性やユーザビリティを提供する，UIMA互換の統合自然言語処理システムであるU-Compare についてデモを交えつつ解説する．U-Compareは様々な互換言語資源群を提供するとともに，それらの組み合わせ・実行・比較評価・統計と視覚化を統合したプラットフォームを提供しており，プログラミングなしにこれらの機能が利用可能であると同時に，必要な部分のみを用いたりカスタマイズしたりすることでユーザ自身のシステムに埋め込むこともできる．

2. Webからのノウハウの獲得

小澤俊介（名古屋大学）

Web 上には，病気への対処法や料理のレシピなど，様々なノウハウが蓄積されているものの，従来のWeb 検索ではノウハウのみを検索することは難しい．これに対し，ノウハウを整理し，提供できれば，様々な事象への対処・対策が容易になる．本発表では，Web からノウハウを獲得する手法について述べる．本手法では，モノを含むパッセージを獲得し，ノウハウ候補を抽出する．モノと用途表現に着目することにより，ノウハウを含むパッセージを精度よく獲得できる．

参加者：23名

第１回 2010年6月23日(水) 17:15-18:45 ＠名古屋大学IB電子情報館IB-012教室

1. バイオメディカル・テキストマイニングの研究紹介

佐々木裕（豊田工業大学）

2. 音声対話システム研究の紹介とその自然言語処理に対する位置づけ

駒谷和範（名古屋大学）

参加者：33名

Page updated

Google Sites

Report abuse