開発データ・評価データ
対話破綻検出チャレンジ用に収集した開発データ・評価データを公開いたします.
1. 内容
本データは対話破綻検出チャレンジの評価用に収集したものです.
本データはNTTドコモが一般公開している雑談対話APIを用いた雑談対話システムとユーザが21発話からなるやりとりを行った対話データで,100対話が収録されています.
各システム発話に対して,対話破綻(対話を継続することが困難)かどうかのアノテーションが3段階で付与されています.30人のアノテータによるアノテーションが付与されています.
対話もアノテーションもクラウドソーシングによって不特定多数のユーザが実施しています.
アノテーションした100対話のうちランダムに選択した20対話を開発用データ(dev)とし,残り80対話を評価用データ(test)としています.
開発データ(dev):20対話
評価データ(test):80対話
雑談対話コーパスは対話研究者を中心としたメンバーによって対話・アノテーションが行われていますが,開発・評価データはクラウドソーシングを用いて一般のユーザによって対話・アノテーションが行われています.そのため,データの質が異なる可能性を考慮し,対話破綻検出チャレンジでは開発データを事前に参加チームに配布し,雑談対話データと評価データの違いを考慮できるようにしました.その後,評価データによって参加チームの性能評価を行いました.
2. 収集方法
雑談対話コーパスを収集した際と同様のフローを用いて,クラウドソーシングで募集した不特定多数のユーザから100 対話の対話データを集めています.
対話破綻アノテーションも同じくクラウドソーシングによって不特定多数のユーザに依頼し,各対話30名で行っています.
対話データの収集にはCrowdWorks を用い,アノテーションにはYahoo!クラウドソーシングを用いています.どちらも性別・年齢の統制は行っていません.
学習用データへのアノテーションは専用のツールを用いましたが,開発・評価用ではクラウドソーシングのシステム上それができないため,クラウドソーシングのシステムが提供するインタフェースを用いて,専用ツールによるアノテーションに可能な限り近い設定になるようにしています.
各発話のアノテーションに際して,対話の先頭からアノテーション対象の発話までしかアノテータに見えないようにしているのは,専用ツールによるアノテーションと同じです.
3. 謝辞
人工知能学会から助成金を頂いて収集しています.
4. 開発データ・評価データのライセンス
本データはMITライセンスのもと,無償・無保障にて研究用・商用を問わず利用できます.ただし,本データを利用して得た成果を学会等で発表する際には,可能な限り,本データについての以下の報告・論文を引用するとともに,NTTドコモの雑談対話APIへの参照をお願いします.詳細は本データに同梱されているライセンスをご覧ください.
○ 研究報告
対話破綻検出チャレンジ
The Dialogue Breakdown Detection Challenge
東中 竜一郎,船越 孝太郎,小林 優佳,稲葉 通将
人工知能学会 言語・音声理解と対話処理研究会 第75回(第6回対話システムシンポジウム), pp.27-32, 2015-10-29
○ 雑談対話APIサイト:
https://www.nttdocomo.co.jp/service/developer/smart_phone/analysis/chat/
5. ダウンロード
こちらからダウンロード下さい.
開発データ(48k)
評価データ(188k)
ライセンス
6. お問い合わせ先
対話破綻検出チャレンジ事務局
dialoguebreakdowndetection-admin<at>googlegroups.com
(<at>を@に置き換えてください)