言語現象

category 属性は言語現象を表すカテゴリで、下に示す一覧のうちどれか一つが示されます。各ペアの t1 と t2 の間では、category で示された言語現象のみが現れるようにしています(句読点の有無など、軽微なものを除く)。文中の複数個所が同じ言語現象で変換される場合は、一つのペアにまとめられています。

カテゴリは、以下の論文を参考に、日本語に合わせたものを用います。

    • Bentivogli et al. (2010) Building Textual Entailment Specialized Data Sets: a Methodology for Isolating Linguistic Phenomena Relevant to Inference.
    • Sammons et al. (2010) “Ask not what Textual Entailment can do for You…”

現在のデータでは、言い回しが大きく変わる場合はフレーズの変換・不一致と分類される場合が多いため、雑多な現象に対してフレーズ関連のカテゴリが付与されています。さらに下位分類を行う可能性があります。