BCCWJのコアデータにIREXの定義に基づきタグ付したコーパスです。
対象文書は、BCCWJのコアデータの136文書であり、Project Next NLP 形態素解析班のテストデータと同じ文書となります。
ご利用いただく際に必要なのはBCCWJとperlになります。
利用方法は下記ファイルをダウンロードし、展開後のREADMEをご覧ください。
2016年2月1日版 (download)
論文
@inproceedings{iwakura-etal-2016-constructing, title = "Constructing a {J}apanese Basic Named Entity Corpus of Various Genres", author = "Iwakura, Tomoya and Komiya, Kanako and Tachibana, Ryuichi", booktitle = "Proceedings of the Sixth Named Entity Workshop", month = aug, year = "2016", address = "Berlin, Germany", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/W16-2706", doi = "10.18653/v1/W16-2706", pages = "41--46", }