新常用漢字表のための漢字出現頻度調査

このページでは,新常用漢字表試案への意見を考えるために行った漢字頻度調査の基本集計データを公開する。


このページでのデータは,参考文献4のGoogleによる「大規模日本語n-gramデータ」及び独自に構築した2007年度教科書コーパスを用いての集計である。


東京外国語大学

芝野耕司


GoogleKanji.xls Google大規模日本語n-gram集計データ

TextKanji.xls  教科書コーパス集計データ  

GoogleChar.txt Google大規模日本語n-gram文字頻度及び異なり単語頻度集計 

TextChar.txt  教科書コーパス文字頻度及び異なり単語頻度集計 

 

NewJoyoComment.pdf  この意見のPDF


参考文献

1. 当用漢字表,

http://www.konan-wu.ac.jp/~kikuchi/kanji/toyob.htm

(2009/04/15確認)

2. 常用漢字表,

http://www.mext.go.jp/b_menu/hakusho/nc/k19811001001/k19811001001.html

 (2009/04/15確認)

3. 公用文における漢字使用,

http://www.bunka.go.jp/kokugo/main.asp?fl=show&id=1000005543&clc=1000000068&cmc=1000005514&cli=1000005532&cmi=1000005540

(2009/04/15確認)

4.工藤拓・賀沢秀人,大規模日本語n-gramデータの公開,2007111日,http://googlejapan.blogspot.com/2007/11/n-gram.html

(2009/04/14確認)

5.芝野耕司,Google n-gramにおける漢字の文字頻度及び単語頻度(添付ファイル参照)

6.芝野耕司,2007年度教科書現代日本語集計資料(添付ファイル参照)

7.芝野耕司編著,増補改訂JIS漢字字典,20025月,日本規格協会

8. 安岡孝一,新常用漢字表(仮称)試案2131+364

http://slashdot.jp/~yasuoka/journal/470522

(2009/04/15確認)

 

ċ
GoogleChar.txt
(180k)
kohji shibano,
2009/04/26 7:46
Ĉ
kohji shibano,
2009/04/26 7:46
Ċ
kohji shibano,
2009/04/26 7:47
ċ
TextChar.txt
(67k)
kohji shibano,
2009/04/26 7:47
Ĉ
kohji shibano,
2009/04/26 7:46
Comments