第4回コンペティション

第4回コンペティションの早押し解答タスク向けに、以下のベースラインを提供しています。

aio4-bpr-baseline (GitHub)

深層ニューラルネットワーク (DNN) に基づく QA システムで多く採用されている Retrieve and Read 方式(または Retriever-Reader 方式)のシステムです。具体的には、DPR [Karpukhin+, EMNLP 2020] を拡張し、文書ベクトルの2値化を行うことでベクトルのサイズ削減を行う手法 BPR [Yamada+, ACL 2021] を、本コンペティションで扱う日本語クイズ問題向けに実装したものです。第4回の早押しタスク向けに、推論時に Reader が出力する解答のスコアが一定以上の時にのみ解答を出力する機構を導入しています。

参考文献

aio4-fid-baseline (GitHub)

本システムも Retrieve and Read 方式のシステムです.具体的には,Retriever部分にDPR [Karpukhin+, EMNLP 2020] を,Reader部分にFiD [Izacard+, EACL 2021] を用いる形で,本コンペティションで扱う日本語クイズ問題向けに実装したものです.FiDが推論する際の生成スコアに閾値を設け,その閾値を超えた時のみ解答の出力を行うようにすることで,早押し形式への対応を行っています.

参考文献

AIO4_GPT_baseline (GitHub)

参考文献

第3回コンペティション

最先端の質問応答 (QA) システムの理解の一助となることを期待して,以下のベースラインシステムを提供しています.

AIO3_BPR_baseline (GitHub)

近年の深層ニューラルネットワーク (DNN) に基づく QA システムで一般的に用いられている Retrieve and Read 方式(または,Retriever-Reader 方式)のシステムです.より具体的には,DPR [Karpukhin+, EMNLP 2020] を拡張し,文書ベクトルのハッシュ化を行うことベクトルのサイズ削減を行う手法 BPR [Yamada+, ACL 2021] を,本コンペティションで扱う日本語クイズ問題向けに実装したものです

参考文献

AIO3_FiD_baseline (GitHub)

本システムも Retrieve and Read 方式のシステムです.具体的にはRetriever部分にDPR [Karpukhin+, EMNLP 2020] を,Reader部分にFiD [Izacard+, EACL 2021] を用いる形で,本コンペティションで扱う日本語クイズ問題向けに実装したものです.

参考文献

AIO3_GPT_baseline (GitHub)

参考文献

2回コンペティション

近年の深層ニューラルネットワーク (DNN) に基づく質問応答 (QA) システムで最も用いられている Retrieve and Read 方式(または,Retriever-Reader 方式)のシステムを提供します.より具体的には,DPR [Karpukhin+, EMNLP 2020] をベースに本コンペティションで扱う日本語クイズ問題で利用できるように改修したものになります. 本ベースラインシステムを理解することで,現在のモダン QA システムの理解の一助となることを期待して,このシステムをベースラインとして提供することにしました. 


実行委員が作成した以下のモデルもベースラインとして公開しています.モデルや推論スクリプトの実装の参考にお役立てください.


参考文献


第1回コンペティション

BERT [Devlin+, 2019] をベースにした読解に基づく解答モデルをベースラインとして提供します.具体的には,Huggingfaceによる実装をベースとして改変を加えたものです.

ベースラインを動作させるのに必要な補助データ読解対象となりえる Wikipedia記事の本文をまとめたファイル)をJSONLフォーマットで提供しています.


参考文献