地球の歩き方旅行記データセット(公開停止中)
日本語旅行記移動軌跡抽出データセット ATD-VSO(公開予定)
概要:近世・近代の日本語歴史的紀行文に場所参照表現をアノテーションしたデータ
データ:TBA
論文:TBA
論文:IPSJ-NL 論文
概要:日本語行政機関ウェブ文書テキストへの固有表現スパン・Wikidataエンティティリンク情報アノテーションデータ
論文:IPSJ-NL 論文(8.3節にて言及)
概要:英語エンティティリンキングデータセット(VoxEL、MEANTIME、Linked-DocRed)に対し、原文の MTPE によって作成した、固有表現スパン・知識ベースリンク情報アノテーションを含む英日対訳データ
概要:日本語ユーザ生成テキストへの形態素解析・単語正規化情報アノテーションデータ
概要:27の専門分野テキストへの単語分割・品詞情報アノテーションデータ
データ:https://alaginrc.nict.go.jp/jpo-outline.html(ALAGIN 会員のみ利用申請可)
論文:WMT 2024 論文
概要:Workshop on Asian Translation(WAT)の Patent Task で使用された特許対訳コーパス