category 属性は言語現象を表すカテゴリで、下に示す一覧のうちどれか一つが示されます。各ペアの t1 と t2 の間では、category で示された言語現象のみが現れるようにしています(句読点の有無など、軽微なものを除く)。文中の複数個所が同じ言語現象で変換される場合は、一つのペアにまとめられています。
カテゴリは、以下の論文を参考に、日本語に合わせたものを用います。
現在のデータでは、言い回しが大きく変わる場合はフレーズの変換・不一致と分類される場合が多いため、雑多な現象に対してフレーズ関連のカテゴリが付与されています。さらに下位分類を行う可能性があります。