NTCIR MedNLPDoc (MedNLP-3)

MedNLPDoc = Medical Natural Language Processing for Clinical Document

Since more electronic records are now used at medical scenes, the importance of technical development for analyzing such electronically provided information has been increasing significantly. Our goal is to promote and support generating the practical tools and systems applicable for the medical industry. In NTCIR-10, we have evaluated a very basic task, named entity recognition (NER) of clinical records. In NTCIR-11, we have evaluated the term normalization technology. Now in this NTCIR-12, we are to challenge a new, more advanced and practical task that is to guess the disease name (represented by the International Codes for Diseases; ICD) from provided medical records. The developed system for this task may be used to directly support an actual application for daily clinical services and in many areas of clinical study.

近年,電子カルテの普及につれ,医療分野での情報処理の重要性が増しています.これをうけて,NTCIR MedNLPタスクシリーズは,医療をサポートする実用的なシステムを生み出すことを目指しています.今回は,日本語のテキスト診療データに適切な診断名とICDコードを付与するのがコアタスクです.複数の病名コードを持ちうる診療データを扱うこのタスクは,文章に対するマルチ・ラベリング問題と位置づけられることから,今回のタスクをMedNLPDocと名付けました.今回のタスクで得られる成果は日常診療および研究分野での実際のアプリケーションにほぼそのまま適用できます.

NEWS!

April 15, 2016: Online Registration is now available./NIIカンファレンス オンライン登録の受付を始めました

http://research.nii.ac.jp/ntcir/ntcir-12/participation.html

March 1, 2016: Draft participant paper submission due/ドラフト参加者論文提出締切

Feb. 5, 2016: Run submission was closed. Draft task overview is released.

Two Types of Tasks

Participants are supposed to extract information from medical reports written by physicians. We plan to hold following two types of tasks:

トレーニング・データには,診療情報管理士(HIM)のためのテキストである「ICDコーディングトレーニング第2版」の診療データを使用します.今回のタスクでは以下の2種類のタスクを用意しています.

<data id="168" sex="MALE" age="26">

<text>

身長180cm、体重60kg、喫煙1箱/日×10日。

</text>

<text type="現病歴">

入院当日、階段昇降時突然の胸痛が出現。

1時間経過しても症状回復しなかったため、救急外来を受診し胸部X線上で自然気胸を認め、chest tubeを挿入し、手術目的で入院した。

</text>

<text type="手術">

thoracoscopic bullectomyを施行。

3hole(第2、5、7肋間)肺尖部にbullaeが2ヶ所、その他1ヶ所に疑わしい部位があったため、3ヶ所looping。

water seal testの結果leak(-)。

第5肋間よりchest tube挿入。

</text>

<text type="入院後経過">

2005年4月1日、手術施行。

術後経過良好で、術後3日目にchest tube抜去。

術後6日目に退院となった。

</text>

<icd code="J931"></icd>

<icd code="Z720"></icd>

</data>

Task 1: Phenotyping task

The participants are expected to give a standard disease name(s) from given medical records. This task corresponds to the phenotyping task in the medical research.

The red color are ICD code(s) (output) that participants should estimate.

与えられた診療データにICDコードを付与します.このタスクは医学研究におけるフェノタイピングに相応します.赤色部分のICDコード(群)を推定するタスクです.

Task 2: Creative task

We are welcoming your creative ideas that will help us to utilize our resulting products in the real world. Especially, a new task plan or annotation scheme for the next MedNLPDOC-2 is desired.

今回のタスクの成果を実際の医療現場に活用するためのアイデアがあれば歓迎します.特に次回MedNLPDoc-2のための新提案やアノテーションスキームを歓迎します.

Expected results

Through MedNLP-1 and MedNLP-2, the core elemental technologies have been evaluated. This task is advanced and practical task, which requires all the previous technologies such as NER, a term level coding task, event time recognition, and so on. With this proposed tasks, we will be able to advance to develop state-of-the-art automatic diagnosis applications. These technologies will be combined to solve the proposed NTCIR-12 task, which is close to the practical application. Therefore, we hope the products of this task can be soon applicable in the real clinical site.

NTCIR-10では診療データからの固有表現抽出,NTCIR-11では名詞単位での病名のコーディング,といった基礎的な自然言語処理技術を扱ってきました.今回NTCIR-12では,私たちは新たなもう一歩進んだ実用的なタスク,診療データに対し病名コードを付与するタスクをデザインしました.前回までのタスクで得られた成果を組み合わせることで,今回のNTCIR-12のタスクを解くことができます.今回のタスクの成果からは,実際の医療現場で使用可能な自動診断アプリケーションの開発が期待できます.

Schedule

• Jan 21, 2016: Distribution Test-set/テストセット配布

• Feb 1, 2016: Early draft task overview release/ドラフト概要論文公開

• Feb 4, 2016: Run submission due/ラン投稿締切

• March 1, 2016: Draft participant paper submission due/ドラフト参加者論文提出締切

• June 7-10, 2016: NTCIR-12 Conference & EVIA 2016 in NII, Tokyo/NTCIR-12 カンファレンス & EVIA 2016 (NII, 東京)

Possibility to collaborate with participants from foreign countries

Estimating the disease name from medical record is gathering worldwide attention, because it can be used to identify patients who are affected with a certain disease for recruiting them in clinical studies/trials targeting this disease. When performing a global clinical study/trial that is recently on the increase, this kind of patient identifying technology must be equally implemented in each language. Therefore, it should be better to try this task also in other languages than Japanese. As several shared tasks that target medical records in English have been held recent years (e.g., i2b2, TREC Medical Records Track, and CLEFeHealth), we are planning to collaborate with one of them. We think we can perform it to specify the target disease, such as diabetes, hypertension, and breast cancer.

We also welcome other languages if proper foreign collaborators or local organizers will be found.

診療データから診断名を推定する技術は,臨床研究においてはある特定の病気にかかっている患者を特定できることから,世界的に注目を集める技術です.世界的な臨床研究を行う場合は,こういった患者特定技術はどの言語においても実装不可欠です.このことから,今回のタスクを日本語以外においても挑戦することが望まれます.英語の診療データを対象としたシェアドタスクはここ数年行われており(e.g., i2b2, TREC Medical Records Track, and CLEFeHealth),私たちはそれらとコラボレートすることも視野に入れています.例えば,糖尿病や高血圧,乳癌などの疾病を対象に今回の技術を応用することができると考えています.もしそのような国外のコラボレーターや国内のオーガナイザーがいれば,日本語圏以外からの参加も歓迎いたします.

Paper submission guideline for Participants

The paper should sufficiently describe your system architecture and resource usage in detail. We will ask you to improve your manuscript when the description is insufficient to reproduce your system design technically. Although this is not a peer-review, a submission without sufficient description might be rejected to publish in the proceedings and presentation by the organizers.

論文記述基準について

解答結果の提出時には、解答器システムの設計および利用リソースの詳細を記した文書を添付ください。記述の情報では再現性が著しく乏しいと判断された場合は、照会の上公式の結果として認めない可能性があります。

Organizers

ARAMAKI Eiji*, Ph.D. (Kyoto University, JST PRESTO) /荒牧英治(奈良先端技術大学院大学、JST さきがけ)

MORITA Mizuki*, Ph.D. (The University of Okayama)/森田瑞樹(岡山大学)

KANO Yoshinobu*, Ph.D. (Shizuoka University, JST PRESTO)/ 狩野芳伸(静岡大学、JST さきがけ)

OHKUMA Tomoko*, Ph.D. (Fuji Xerox Co. Ltd.)/大熊智子(富士ゼロックス)

Advisors

MASUICHI Hiroshi†, Ph.D. (Fuji Xerox Co. Ltd.)/ 増市博 (富士ゼロックス)

Sponsorship

Fuji Xerox Co. Ltd./富士ゼロックス株式会社

IR-Advanced Linguistic Technologies Inc./株式会社 アイアール・アルト