2009-07-04 青空文庫講演資料

 7月4日に青空文庫の主催で行われた講演会の発表資料
工藤拓・賀沢秀人,大規模日本語n-gramデータの公開,2007111日,http://googlejapan.blogspot.com/2007/11/n-gram.html
(2009/04/14確認)
 添付の集計は,青空文庫で議論になっている「ヶケ」の用例を確認するために行ったものです。

 当初の仮説は,
    「カタカナの“ケ”を“ヶ”と同様に用いることが広く受け入れられており,“誤り”とする従来の方針は変更すべきである」
です。

集計の手順は次の通り。

1.日本語n-gramのunigramデータから,漢字を含む単語を抽出する。
2.漢字単語から(ヶ|ケ)を含む用例を抽出する。
3.2.の用例中でカタカナ語として用いられる通常のカタカナとしての用例を削除する。

集計結果は,次の通り。
    「当初の仮説を支持する結果は,得られない。すなわち,カタカナの“ケ”を“ヶ”と同様に用いることは広く受け入れられていない。」
という結果です。


2009/07/05 芝野
shibano@aa.tufs.ac.jp
Ĉ
kohji shibano,
2009/07/04 18:41
Ċ
kohji shibano,
2009/07/10 2:36
Comments