使用契約

このコーパスのデータ、及びそれに付随する文書の使用は、CC BY-NC-SA 4.0ライセンスに準拠しています。このコーパスを使用する際には、あなたは以下のライセンスの条項に同意することになります。

1.データの個人情報保護について

データが収集されたとき、話者は彼らのプライバシーが保護されているという条件で書き起こしデータの公開に同意しました。そのために、話者・家族・知人などの名前はす​​べて仮名にしてあります。※

また、組織名やその他の固有名詞に関しては、その組織が非常に小さく具体的なものであれば、その名前を変更するようにしています。

参加者のプライバシーを保護することができないと判断した箇所は、書き起こしデータからその箇所を省略しています。このコーパスを使用する際は、あなたは話者のプライバシーを厳守することに同意しなければなりません。万が一、偶然に話者を認識できることがあれば、あなたはそのような認識を秘密にしておく義務があります。また、コーパスデータを使用する際は、参加者のプライバシーが保護されるよう、データを使用に注意しなければなりません。

※同じ人物に同じ仮名を一貫して使用しているとは限りません。また会話内の著名人の名前は変更していません。

2.データの不正確性について

書き起こしをした際に、会話の内容より形態素解析を優先しました。そのため、話者の言い淀み、言い間違え、繰り返しなどはある程度削除され、意味が通らない不明瞭な発言も削除されました。

コーパスをより正確に作成するために努力をしてきましたが、話し言葉は非常に扱いにくく、品詞を分けた後の出力データには多くの間違いがありました。そのため、各ファイルを1行ずつ読み込み、見つかったエラーを削除しています。しかしながら、すべてのエラーを削除することはできず一部が残ったままです。

従って、データ、及び付随する文書が正確であること、または特定のアプリケーションで機能することは保証できません。そして、このデータ、またはそれに付随する文書を使用の際に発生する損害に関して、作成者はいかなる責任も負いません。

3.データをご使用の際は

このコーパスは、日本学術振興会の科学研究費補助金(C)17K02761の助成を受けています。

このコーパスのデータを使用する際は、必ず次の参考文献を添付してください。

●日本語の場合:

ヘファナン・ケビン(2012)「関西弁コーパスの紹介」『総合政策研究』41号 157-164.

●英語の場合:

Heffernan, Kevin. (2012). Kansaiben koopasu no shookai [An introduction to the Kansai dialect corpus]. Journal of Policy Studies, 41, 157-164.

Creative Commons CC BY-NC-SA 4.0 ライセンス