第256回自然言語処理研究発表会

[1] ユーモアを科学するー人間を超える面白いユーモアの生成は可能か？ー
荒木健治（北海道大学）
現在広く普及しているスマートフォンやAIスピーカー上の対話エージェントは，雑談システムとしての能力が不十分であり，話していて楽しいシステムとはなっていない．この問題を解決するためには，ユーモア処理の高度化が必須である．その第一段階として，67,000 件の駄洒落データベースの開発を行い，面白さのスコアの付与を行った．駄洒落データベースはHP上で公開され広く利用されている．また，駄洒落データベースを用いて，面白さのスコアの平均値の推移，評価者ごとのスコアの分布，評価者間の一致度，平均スコアの上位のものなどの分析を行った．この結果，駄洒落の面白さの感じ方には個人差が大きいことや対話形式で表現されている場合に面白さを感じることなどが明らかとなった．これらのことより文脈情報，背景知識が駄洒落の面白さの感じ方の大きな要因となっていることが確認された．さらに，駄洒落データベースを用いた駄洒落生成システムの開発を行い，性能評価実験を行った．現在，Twitterを対象として駄洒落データベースに収録された駄洒落の検索を行い文脈情報を収集し，文脈情報が付与された駄洒落データベースの開発を進めている．本講演では，これまで行った一連のユーモア処理に関する研究の概要を述べた上で，駄洒落データベースの構築方法，駄洒落生成システムの性能評価，駄洒落データベースに文脈情報を付与する方法などについて述べ，ユーモア研究について考察する．

15:00-16:30 [3件] 語彙・言語理解（座長：須藤克仁）

[2] Zero-Shot Cross-Lingual Transferの評判分析における多言語モデルとMT + 単言語モデルの性能比較
〇佐藤匠真，新納浩幸（茨城大学）
多言語モデルを利用した Zero-shot Cross-Lingual Transfer とは言語A の訓練データを利用して，多言語モデルを fine-tuning し，その fine-tuning したモデルを利用して言語B のテストデータを解析する技術である．一方、言語A から言語B の翻訳機と言語 B の単言語モデルがあれば，言語A の訓練データを言語B に翻訳し，その翻訳したデータから言語B の単言語モデルをfine-tuning できる．そしてそのfine-tuning したモデルを利用して，言語B のテストデータを解析できる．このように翻訳機が利用できれば単言語モデルであっても，Zero-shot Cross-Lingual transfer と同等の処理が可能になる．本論文では言語Aを英語，言語Bを日本語，またタスクを評判分析として，上記2つの手法（多言語モデル vs MT ＋単言語モデル）の性能比較を行った．実験の結果，多言語モデルよりもMT+単言語モデルの性能の方が高かった．

[3] 日本語を母語とする英語学習者の英語語彙数調査
藤田早苗，小林哲生，服部正嗣（NTT コミュニケーション科学基礎研究所）
我々は、日本語を母語としTOEICスコアを提出可能な大学生約120人を対象に、 12000語以上の英単語について、知っているかどうかの調査を実施した。 TOEICスコアと語彙数の関係や、NTTで構築している日本人英語学習者にとっての英単語親密度データベースとの関係を分析する。

[4] 非構造知識検索を用いた自己適応型固有表現認識
〇西田光甫（NTT 人間情報研究所 / 東京大学），吉永直樹（東京大学生産技術研究所），西田京介（NTT 人間情報研究所）
固有表現認識（NER）は，人名や組織名のようなドメインに依存しないエンティティだけでなく，政治ドメインにおける選挙や音楽ドメインにおけるアルバムなど，目標ドメイン固有のエンティティを抽出・分類するために活用できる．しかしながら，個々のユーザが自身の興味のある目的ドメインにおいて，高精度のNERを行うために必要な大規模な訓練データや構造化された知識ベースを構築し，高精度なNERを実現することは難しい．そこで本稿では，生のテキスト集合である非構造知識から，個々の入力文に対して必要な知識テキストを都度検索する，自己適応型固有表現認識を提案する．提案モデルは，まず入力のみから固有表現抽出を行ったのち，確信度の低いラベルを含むエンティティをクエリとした知識検索を行い，知識を用いた予測によって元の予測を改善する2段階のモデルである．CrossNERデータを用いた評価実験により，提案モデルがベースラインをF1で2.35ポイント上回ることを確認した．

16:50-17:35 [招待講演] （座長：吉永直樹）

[5] 社会の変化を探索するためのソーシャルビッグデータ可視化
伊藤正彦（北海道情報大学）
選挙、スポーツイベント、事故・災害など、様々なイベントが毎日のように発生し、人々の活動や関心に影響を与えている。ソーシャルメディアやセンサーデバイスから得られる時間情報と空間情報を含むソーシャルデータなどから、人々の行動や考えの変化を分析する情報可視化の事例を紹介する。

5月28日(日)

10:00-12:00 [4件] 言語生成（座長：吉永直樹）

[6] English-Japanese multimodal machine translation using the CLIP model
〇崔少東，Ying Xinyan，新納浩幸（茨城大学）
Multi-modal machine translation is a cutting-edge technology that combines computer vision and text translation, aiming to enhance translation quality. However, recent multi-modal machine translation models often focus solely on visual features. To address this limitation, we propose a feature extraction method based on the CLIP pre-trained model. Our approach utilizes a transformer model that integrates label features and text features, and then employs a visual transformer to process visual features. We conducted experiments on the Flickr30kEnt-JP English-Japanese multi-modal machine translation dataset, which provided compelling evidence for the effectiveness and soundness of our proposed solution.

[7] 日本語 CommonGen に対する ChatGPT の性能調査
〇鈴木雅人，新納浩幸（茨城大学）
CommonGen は入力された複数個のキーワードに対して、それらキーワードが含まれる文を生成する生成型の常識推論タスクである。我々はこれまで日本語CommonGen のデータセットと日本語 CommonGen に対する T5 モデルを構築し、本タスクに対する課題や問題点を考察してきた。一方、昨年の11月に OpenAI が発表した ChatGPT はプロンプトの工夫次第で様々なタスクをこなせる非常に強力な大規模言語モデルである。本論文では我々が構築した日本語CommonGen のデータセットに対するChatGPT の性能を評価する。実験の結果、ChatGPT (GPT-3.5 版) は、我々が構築した T5 モデルと同等程度の性能しか示せなかったが、ChatGPT (GPT-4 版) は非常に高い性能であった。この実験から ChatGPT の常識推論能力について考察する。

[8] 意味と表層の類似度を制御した言い換えによるデータ拡張を用いた事前学習済みモデルの性能改善
〇小笠雄也（大阪大学），梶原智之（愛媛大学），荒瀬由紀（大阪大学）
言い換え生成技術は様々な自然言語処理タスクのデータ拡張に応用されてきた．データ拡張においては，意味的な類似度が高くかつ多様な言語表現を提供する言い換えが有益である．しかし原文からの表層の変化が大きくなるにつれて意味を保持することが難しいため，このような言い換え文の生成は困難である．さらにデータ拡張を適用するタスクによっても，望まれる意味・表層の類似度は異なる．そこで本研究では意味類似度が高く表層類似度が低い言い換えを高品質な言い換えと定義し，意味・表層類似度を制御可能な言い換え生成手法を実現する．具体的にはデコーダにサンプリングを適用した折り返し翻訳により，多様な品質の言い換え候補を大量に自動生成する．生成した候補の中から高品質な言い換え文対を抽出し，意味・表層類似度をタグとして付与して事前学習済み系列変換モデルをfine-tuningすることで，類似度制御可能な言い換えモデルを構築する．提案手法によるデータ拡張を事前学習済み言語モデルの性能改善タスクに適用し，その有効性を検証した．対照学習を行う手法，fine-tuning前に中間タスクによる追加訓練を行う手法，それぞれにおいてデータ拡張により既存手法の性能を改善することが明らかとなった．

[9] 系列変換モデルにおける語彙制約を用いた複数出力候補の統合
〇宮野稜大（大阪大学），梶原智之（愛媛大学），荒瀬由紀（大阪大学）
機械翻訳では生成文を後編集することで品質を改善するAutomatic Post-Editing (APE) が用いられるが，構築コストの高い人手タグ付きコーパスを要するため，他の言語生成タスクに適用するハードルは高い．本研究ではAPEに着想を得つつ，人手によるコーパスを必要としない手法を提案する．具体的には，系列変換モデルのNベスト出力を用いて正誤予測を行い，誤りと予測された語を負の制約，正しいと予測された語を正の制約として，語彙制約を適用したデコードを再び行う．これにより，Nベスト出力に含まれていた正しい語を含みつつ，誤りを避けた文を生成する．言い換え生成および要約タスクにおける提案手法の有効性を評価する実験を行った．その結果，いずれのタスクにおいても提案手法はビームサーチによる文生成を上回る性能を達成することを確認した．

13:30-15:30 [4件] 言語処理応用（座長：内田ゆず）

[10] 引用文献に着目した情報科学論文からのデータセットの抽出
〇大嶋悠司（奈良先端科学技術大学院大学 / 株式会社メルカリ），進藤裕之，渡辺太郎（奈良先端科学技術大学院大学）
情報科学分野では論文発表ペースの増加に伴い，提案された手法の性能や評価に用いるデータセットを把握し続けることが困難になっている．そのため実験情報(実験に使用されたデータセット，実験のタスクと評価指標及び性能)を集約した知識ベースの構築が手法の比較や検索に有用である．しかし，人手での実験設定の抽出や知識ベースの構築には限界があるため，実験情報の自動抽出とその紐付けが盛んに研究されている．これまでの研究では，実験情報の種類が予め固定されており，対象の論文がその実験情報のうちどれに紐づくかを推定していた．そのため新規のデータセットを含む実験情報に紐付けることができないが，実際には新規のデータセットは頻繁に提案されるためその扱いが課題であった．そこで本研究では，実験情報に含まれるデータセットが引用文献に含まれることに着目し，引用文献の中から適切な文献を選択することでデータセットを同定するというアプローチを用いる．このアプローチによって，新規のデータセットであっても実験に使用されたデータセットとして正しく紐付けられることを示した．

[11] 大規模言語モデルを活用した顧客応対業務自動化の実現可能性検証
〇有留一博（横浜市立大学），辰巳守祐，白水優太朗，藤本拓（NTTドコモ）
顧客応対業務は，業種業態問わず数多くの企業で重要性が増しているが，人的コストが多くかかるという課題がある．顧客応対のうち，本研究では，Twitterでの顧客応対自動化に焦点を当て，その実現可能性を検証する．言語モデルの大規模化が進む動向を踏まえ，学習コストの低いPrefix-Tuningを事前学習済みの大規模言語モデルに施し，実験を行った．In-context learningと比較して，人間の表現に近い応答文が生成可能であることを主観評価と自動評価によって示した．

[12] 多次元項目反応理論による短歌の評価傾向の分析
〇川島寛乃（慶應義塾大学），持橋大地（統計数理研究所）
短歌は日本の伝統的な詩形の一つであり，これまで文学としての研究は行われてきているが，その評価について定量的な研究は行われていない．そこで本研究では，複数の短歌について複数の評価者が「良い--悪い」および「好き--嫌い」の軸でK段階の評価を付与した短歌評価データに対して，多次元の項目反応理論に基づいて，短歌の潜在座標および各評価者の評価傾向を分析する手法を提案する．多次元項目反応理論における潜在変数の次元数を変化させることで，短歌の評価に影響する要因の分解や，作者ごとの短歌の傾向の分析，評価者のグループ間の相違を統計的に比較することが可能になった．

[13] 論文テキストを用いた化合物探索の漸進的効率化
〇塚越駿（名古屋大学），岩田和樹（名古屋工業大学），花田博幸（理化学研究所），笹野遼平（名古屋大学），竹内一郎（名古屋大学 / 理化学研究所），魚住信之（東北大学），有澤美枝子（九州大学）
創薬や材料化学をはじめとする多くの分野で目的の性質を満たす化合物の探索が日常的に行われている．しかし，実際の化合物を用いた性質の調査には大きなコストと時間が必要であり，化合物探索の効率化のために有望な化合物を選定する技術が求められている．本研究では，論文テキストから化合物の物性を予測することで，有望な化合物を選定し，それら少数の化合物のシミュレーションにより得られたデータをもとに物性予測モデルを改善することで，化合物探索を漸進的に効率化するシステムを提案する．

15:30-15:45 クロージング

発表申込

発表申込締切: 2023年4月21日 (金) ※終了しました
発表申込サイト: https://ipsj1.i-product.biz/ipsjsig/NL/

発表申込受付は先着順です．
多数のお申し込みを頂いた場合，次回の研究会でのご発表をお願いする場合があります．
なるべく早めにお申し込み下さい．
発表申込締切後の発表キャンセルは原則としてできません．
発表申込後にキャンセルの必要が生じた場合は，至急ご連絡ください．

原稿提出

原稿提出締切: 2023年5月1日 (月) ※厳守 ※終了しました
原稿提出サイト: https://ipsj1.i-product.biz/ipsjsig/NL/
（発表申込受付時に発行される認証情報が必要です）

発表申込後，原稿提出締切までに原稿が到着しない場合には，原則として発表を取り消します．
原稿締切後の原稿差し替えはできません．
原稿締切後は，訂正版のアップロードやウェブ上での配布などの差し替えは一切できませんので，予めご留意ください．
※正誤表の掲載が可能な場合がありますのでご相談ください．

発表者の方へ

研究会参加要領の「発表申込」をご覧ください。→ 研究発表会への参加

参加者の方へ

参加申込を開始しました。
IPSJマイページ https://www.ipsj.or.jp/mypage.html からお申し込みください。

現地参加の方々は会場受付で参加申込内容の確認をさせていただきます。
申込完了時に送付されるメールを当日提示できるようご準備ください。

詳細は研究会参加要領の「参加申込」をご覧ください。→ 研究発表会への参加

問い合わせ先

吉永直樹（東京大学）
ynaga ?at? iis.u-tokyo.ac.jp

Page updated

Report abuse

第256回 自然言語処理研究発表会

開催日時

会場

プログラム