Unifying, Understanding, and Utilizing Unstructured Data in Financial Reports
Unifying, Understanding, and Utilizing Unstructured Data in Financial Reports
U4タスクは、有価証券報告書(有報)に含まれる表から正しく情報を抽出することを目的としたタスクです。
Table Retrieval SubtaskとTable QA Subtaskの、2つのサブタスクから構成されます。
対象企業数:100社(2021年度のTOPIX100算出対象の企業)
1企業あたりの対象有報数:1文書(対象企業の2021年度提出分)
対象有報総数:100文書(1文書 × 100社 = 100)
データセットは2024年7月に公開しました。参加登録の流れは次の通りです。
NTCIR-18 の参加申込 http://research.nii.ac.jp/ntcir/ntcir-18/howto-ja.html
U4 のアカウント作成(申込には、NTCIR-18の申込で登録したチーム名が必要になります)
下記のリーダーボードの「参加申し込み」をクリックし、必要事項を入力してから送信してください。
データダウンロード https://github.com/nlp-for-japanese-securities-reports/ntcir18-u4
木村泰知 小樽商科大学
佐藤栄作 小樽商科大学
門脇一真 株式会社日本総合研究所
乙武北斗 福岡大学