関西弁コーパス

インタビューが始まる前の準備

紹介

関西弁コーパスは、大学生が家族や親密な知り合いと行った社会言語的なインタビューの収集です。基本的に、学生と話者は、丁寧で標準的な日本語でインタビューを開始しますが、徐々にリラックスして、だんだんとお互いに慣れ親しんできたような話しぶりに切り替えていきます。話者の年齢は15歳から83歳までです。コーパスは、Mecabパーサーを使用して解析され、品詞情報が付けられています。すべての行のデータを手作業でチェックし、間違いの訂正を行いました。現在、コーパスには、インタビューが200件以上あり、約121万の形態素と26万の記号で構成されています。

簡易なサンプル(形態素タグ付き)

簡易なサンプル(形態素タグ無し)