開発データ・評価データ

対話破綻検出チャレンジ用に収集した開発データ・評価データを公開いたします．

1. 内容

本データは対話破綻検出チャレンジの評価用に収集したものです．

本データはNTTドコモが一般公開している雑談対話APIを用いた雑談対話システムとユーザが21発話からなるやりとりを行った対話データで，100対話が収録されています．

各システム発話に対して，対話破綻（対話を継続することが困難）かどうかのアノテーションが3段階で付与されています．30人のアノテータによるアノテーションが付与されています．

対話もアノテーションもクラウドソーシングによって不特定多数のユーザが実施しています．

アノテーションした100対話のうちランダムに選択した20対話を開発用データ（dev）とし，残り80対話を評価用データ（test）としています．

開発データ(dev)：20対話

評価データ(test)：80対話

雑談対話コーパスは対話研究者を中心としたメンバーによって対話・アノテーションが行われていますが，開発・評価データはクラウドソーシングを用いて一般のユーザによって対話・アノテーションが行われています．そのため，データの質が異なる可能性を考慮し，対話破綻検出チャレンジでは開発データを事前に参加チームに配布し，雑談対話データと評価データの違いを考慮できるようにしました．その後，評価データによって参加チームの性能評価を行いました．

2. 収集方法

雑談対話コーパスを収集した際と同様のフローを用いて，クラウドソーシングで募集した不特定多数のユーザから100 対話の対話データを集めています．

対話破綻アノテーションも同じくクラウドソーシングによって不特定多数のユーザに依頼し，各対話30名で行っています．

対話データの収集にはCrowdWorks を用い，アノテーションにはYahoo!クラウドソーシングを用いています．どちらも性別・年齢の統制は行っていません．

学習用データへのアノテーションは専用のツールを用いましたが，開発・評価用ではクラウドソーシングのシステム上それができないため，クラウドソーシングのシステムが提供するインタフェースを用いて，専用ツールによるアノテーションに可能な限り近い設定になるようにしています．

各発話のアノテーションに際して，対話の先頭からアノテーション対象の発話までしかアノテータに見えないようにしているのは，専用ツールによるアノテーションと同じです．

3. 謝辞

人工知能学会から助成金を頂いて収集しています．

4. 開発データ・評価データのライセンス

本データはMITライセンスのもと，無償・無保障にて研究用・商用を問わず利用できます．ただし，本データを利用して得た成果を学会等で発表する際には，可能な限り，本データについての以下の報告・論文を引用するとともに，NTTドコモの雑談対話APIへの参照をお願いします．詳細は本データに同梱されているライセンスをご覧ください．

○ 研究報告

対話破綻検出チャレンジ

The Dialogue Breakdown Detection Challenge

東中竜一郎,船越孝太郎,小林優佳,稲葉通将

人工知能学会言語・音声理解と対話処理研究会第75回(第6回対話システムシンポジウム), pp.27-32, 2015-10-29

○ 雑談対話APIサイト:

https://www.nttdocomo.co.jp/service/developer/smart_phone/analysis/chat/

5. ダウンロード

こちらからダウンロード下さい．

開発データ（48k）

評価データ（188k）

ライセンス

6. お問い合わせ先

対話破綻検出チャレンジ事務局

dialoguebreakdowndetection-admin＜at＞googlegroups.com

(＜at＞を@に置き換えてください)

Page updated

Google Sites

Report abuse