BCCWJ基本固有表現抽出コーパスのページ

BCCWJ NEコーパス (English page)

BCCWJのコアデータにIREXの定義に基づきタグ付したコーパスです。

対象文書は、BCCWJのコアデータの136文書であり、Project Next NLP 形態素解析班のテストデータと同じ文書となります。

ダウンロード

ご利用いただく際に必要なのはBCCWJとperlになります。

利用方法は下記ファイルをダウンロードし、展開後のREADMEをご覧ください。

リンク

論文

@inproceedings{iwakura-etal-2016-constructing, title = "Constructing a {J}apanese Basic Named Entity Corpus of Various Genres", author = "Iwakura, Tomoya and Komiya, Kanako and Tachibana, Ryuichi", booktitle = "Proceedings of the Sixth Named Entity Workshop", month = aug, year = "2016", address = "Berlin, Germany", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/W16-2706", doi = "10.18653/v1/W16-2706", pages = "41--46", }