任務定義
NTCIR-11 RITE-VAL中文項目分為兩大項
事實確認 (Fact Validation, FV)
事實確認 (Fact Validation, FV)
系統將被給予一個文句 t2,並嘗試自中文維基百科中找尋可以推論出 t2 的文字片段,或找出與 t2 矛盾的文字片段。
若成功找出特定文字片段可以推論出 t2,則為真 (Entailment, E),
若找出特定文字片段與 t2 矛盾,則為假 (Contradiction, C),
除此之外則為未知 (Unknown, U)。
在 FV 子任務中,題目範例如下:
- t2: 歐巴馬是美國的一位總統
- 在維基百科「巴拉克·歐巴馬」詞條中,有文句說他是「第44任美國總統」,
- 故本題判斷為真 (E)。
- t2: 歐巴馬在1960年出生
- 在維基百科「巴拉克·歐巴馬」詞條中,有文句說他出生於「1961年8月4日」,
- 故本題判斷為假 (C)。
- t2: 基特在1995年為大聯盟球員開球
- 在中文維基百科中找不到1995年為大聯盟開球的人是誰,無法證實也無法反駁,
- 故本題判斷為未知 (U)。
系統驗證 (System Validation, SV)
系統驗證 (System Validation, SV)
分為BC與MC兩部分。
BC: 系統將被給予兩個文句t1及t2,並嘗試直接判斷t1是否能推論出t2
- Y: 若t1能推論出t2,則為真;
- N: 否則為假。
MC: 系統將被給予兩個文句t1及t2,並嘗試直接判斷t1與t2間的語意關係,
- B: 若t1能推論出t2且t2能推論出t1,則為雙向推論。
- F: 若t1能推論出t2但t2無法推論出t1,則為單向推論。
- C: 若t1與t2相互牴觸,則為矛盾。
- I: 若t1無法推論出t2且t2無法推論出t1,則為獨立敘述。
在 SV 子任務中,題目範例如下:
- t1: 歷史上沒有吉力馬札羅山火山噴發的記錄。
- t2: 歷史上沒有吉力馬札羅山火山爆發的記錄。
- 因為「火山噴發」與「火山爆發」同義,
- 故本題在 BC subtask 判斷為真 (Y)、在 MC subtask 判斷為雙向推論 (B)。
- (註:本題屬於 synonymy:lex 類型)
- t1: 手語並不是世界共通的。
- t2: 手語並不是亞洲共通的。
- 雖然「世界」的範圍包含了「亞洲」,
- 但世界不共通不代表在亞洲也不共通,
- 故本題在 BC subtask 判斷為假 (N)、在 MC subtask 判斷為獨立敍述 (I)。
- (註:本題屬於 spatial 類型)
本項子任務考慮多種判斷推論關係時可能使用的語言現象。
參酙 NTCIR-10 RITE2 日文任務 Unit Test 所訂出的現象列表,
這次也訂出為中文所設計的各種語言現象,
並為各種類型均以人工產生句對,做為建構及測試所用之資料集。
Formal testset 中僅含 (t1, t2) 句對,不會提供語言現象類型資訊。
使用於本次評比之中文語言現象包括: