ソーシャル・コンピューティング・ジャーナルクラブ (SocJC)

ソーシャル・コンピューティング・ジャーナルクラブは,奈良先端科学技術大学院大学ソーシャル・コンピューティング研究室を中心とした研究,論文紹介を行う活動です.当初は研究室内でオンサイトで行っていましたが,2020年末からオンラインで,主に医療言語処理を中心した研究紹介を行っています.参加希望の方は, socialcomputing-office [at] is.naist.jp までお名前,ご所属・身分,バックグラウンドなどをご連絡下さい.

月の最後の水曜日の18:30-19:30 WebExを用いて行っています(WebExリンクは,1週間前に,ご連絡いたします).

▲第37回(オンライン第15回) 2022-6-29

時間:18:30-19:30

場所:オンライン

講演者:荒牧 英治(NAIST),矢田 竣太郎(NAIST)西山智弘(NAIST M2

タイトル:学会参加報告

概要:人工知能学会2022「医療言語処理の拡張と連携」,NTCIR-16 Real-MedNLP,サンアントニオ乳癌シンポジウム,メディカルAI学会,LREC2022@Franceなど,最近開催された学会参加報告を行います

▲第36回(オンライン第14回) 2022-4-27

時間:18:30-19:30

場所:オンライン

講演者:樋口 千洋先生(国立研究開発法人 医薬基盤・健康・栄養研究所)

タイトル:バイオインフォマティクス研究者が自然言語処理に興味を持った経緯と現在のとりくみ

概要:発表者は民間と公的機関でバイオインフォマティクス研究を行ってきました。自然言語処理は専門ではありませんが、偶然と必然的な背景から自然言語処理に深く興味を持つようになりました。今回はどのような偶然と必然から自然言語処理(関連技術)に興味を持ち、将来的にどのような期待を有しているか、現在どのような自然言語処理関連研究に取り組んでいるかを発表できればと考えています。

▲第35回(オンライン第13回) 2022-3-30

時間:18:30-19:30

場所:オンライン

講演者:荒牧 英治(NAIST),矢田 竣太郎(NAIST)中村 優太先生(東京大学)

タイトル:NLPの臨床応用事例の検討 (IMIA Yearbook Review paperより)

概要:自然言語処理(NLP)の急速な発展は,医療分野からも注目されている.この結果,医療言語処理の論文は毎年数多く発表されているものの,実用的な製品開発との間には,まだギャップがあり,実臨床での使用例は乏しいのが現況である.今回,各医療領域において医療用NLPはどのような成果を上げているのか,NLPの実用化にはどのような負担があるのか,などのサーベイを行ったので報告する.本検討はIMIA Yearbookのreview paper 執筆のために行った調査の報告でもある.

▲第34回(オンライン第12回) 2022-3-2

時間:18:30-19:30

場所:オンライン

講演者:西山智弘(NAIST M1)

タイトル:ソーシャルメディアにおける服薬ノンコンプライアンス発言の分類と医薬品構造類似度を用いたコーパス可搬性の検討

概要:ソーシャルメディアデータを用いたヘルスケア情報のモニタリングは人々の健康維持に役立つ可能性がある.我々は,ソーシャルメディアにおける服薬コンプライアンスに関連するラベルを付与した初の日本語コーパスである「MediAコーパス」を構築している.本コーパスは20種類の医薬品について,服薬コンプライアンスの概念に基づき,ユーザによる発言の影響力の大きさを考慮してラベル付けされたデータセットである.本研究では,医薬品の性質に着目し,MediAコーパスを用いた分類結果を分析した.out-of-domainでの検証結果から,分類結果と医薬品の構造類似性に相関があることが示された.このことから,コーパスに含まれない医薬品に関する発言の分類への構造類似性の適用可能性が示唆された.

▲第33回(オンライン第11回) 2021-12-1

時間:18:30-19:30

場所:オンライン

講演者:中村 優太先生(東京大学)

タイトル:言語モデルのプライバシーを考える〜安全な公開と共有に向けて〜

概要:多くの事前学習済み言語モデルが公開されるようになり,いまや誰もが手軽にBERTなどの威力を体感できるようになりました.しかし,言語モデルを公開してもよい条件として,個人情報保護の観点からのガイドラインや法制度は確立していません.そこで今回は,言語モデルを公開・共有する際の個人情報漏洩リスクをどのように評価していくべきかということについて,先行研究の紹介を交えながら,皆様と議論させていただければ幸いです.(※2020/9/28に行ったオンライン研究紹介(オンライン第1回ジャーナルクラブ)の続報となります.)

▲第32回(オンライン第10回) 2021-9-29

時間:18:30-19:30

場所:オンライン

講演者:荒牧 英治(NAIST)

タイトル:Fuzzy NER: 医療テキストに特化した固有表現アノテーションの枠組みと評価にむけて

概要:医療言語処理はコーパスデザイン・構築が重要なコストとなっており,中でも,固有表現認識(NER)は,多くのシステムの基礎となるタスクとして,多くの研究がある.しかし,他の自然言語処理の個人名,組織名といったアノテーションと異なり,患者の訴える症状(主訴)など,一般的な言語処理とNERと整合しない場合も多く,アノテーションのデザイン,コーパス構築の悩みとなっている.本発表では,医療テキストに特化したアノテーションについてのアイデアを共有し,議論する.

▲第31回(オンライン第9回) 2021-7-28

時間:18:30-19:30

場所:オンライン

講演者:進藤 裕之先生(NAIST)

タイトル:ドキュメントを構造化するための実用的な情報システムについて

概要:論文や特許などの専門文書を対象として,オントロジーや辞書などのリソースと,ドキュメントの構造化アノテーションを蓄積していくための実用的な情報システムについて紹介します.また,PDFのようにグラフィックス情報を持つドキュメントから情報を抽出したりアノテーションを行う方法についても紹介します.

▲第30(オンライン第8回) 2021-6-30

時間:18:30-19:30

場所:オンライン

講演者:勘場 大 (NAIST社会人学生)

タイトル:製薬会社の現状とこれから 〜各社の取り組みをまとめてみる〜

概要:社会人学生が最近のニュースから昨今の製薬業界の状況を推察し,今後は製薬会社がどこに向かおうとしているのかについて各社の取り組みを紹介します.また,後半は学生として私自身の研究を紹介します.

▲第29(オンライン第7回) 2021-5-26

時間:18:30-19:30

場所:オンライン

講演者:青木 美和先生(東京大学医学部附属病院)

タイトル:看護記録とはなにか?領域別看護記録の特徴と活用 -高度看護実践における意思決定支援に向けて-

概要:看護テキスト記録の特徴を整理し、領域別看護実践における記録の活用について紹介します。また、単施設の経過記録をMEDIS看護実践用語標準マスターに分類した実験結果なども紹介します

▲第28回(オンライン第6回) 2021-4-28

時間:18:30-19:30

場所:オンライン

概要:自己紹介と課題共有

▲第27回(オンライン第5回) 2021-3-31

時間:18:30-19:30

場所:オンライン

講演者:荒牧 英治 (NAIST)

題目:医療言語処理シェアードタスク(コンテスト型ワークショップ)の動向

概要:医学臨床研究と情報学研究の大きな違いは,医学が患者を対象とし再現が困難であるのに対し,後者は同じデータセットを使って何度でも同じ条件で,実験を繰り返せる点です.

情報学はこの再現性を最大限活し,データセットを公開,場合によっては,複数の研究チームが同じデータセットで精度を競う,所謂,シェアードタスク,が研究のドライビングフォースとなってきました.

医療言語処理においても,シェアードタスクは2006年の米国i2b2 NLPから開始され,日本語でも2011-2015年NTCIR MedNLPが開催され,休止ののち,2022年から再開催予定です.

本発表では,これまでのシェアードタスクのタスクやデータについて外観し,今後のタスクについて議論できればと思っています.


[本日のスライド]

▲第26回(オンライン第4回) 2021-3-4

時間:18:30-19:30

場所:オンライン

講演者:篠原 恵美子先生(東京大学 大学院医学系研究科 医療AI開発学講座 特任助教)

題目:実用的な医療自然言語処理の研究を目指したテキストアノテーションの試み

概要:カルテの自由記載の自然言語処理の研究を推進するうえでは、公開コーパスの存在が重要な役割を果たします。現在当講座で作成中のコーパスについてご紹介します。

▲第25回(オンライン第3回) 2021-1-27(

時間:18:30-19:30

場所:オンライン

講演者:香川 璃奈先生(筑波大学・医学医療系・医療情報マネジメント学講師,筑波大学附属病院・医療情報経営戦略・ 副部長 )

題目:「読み手」「書き手」ともにおろそかにしない医療情報学研究を目指して

概要:カルテのテキストはプライバシーの観点から教育研究目的の公開と共有が難しく、研究者のアクセスが事実上禁止されている国や地域も存在します。クラウドソーシングを利用して本物らしい擬似プログレスノートの作成を試みた事例を紹介します。また、データ入力のフォーマットが入力結果にバイアスを誘導する実験結果なども紹介します。

▲第24回(オンライン第2回) 2020-12-17(木)

時間:18:30-19:30

場所:オンライン

講演者:矢田 竣太郎(NAIST)

題目:電子カルテ可視化システムに関して

概要::読影所見や診療記録といった医療文書に対して一般的に適用可能な医療固有表現+関係アノテーションの仕様と,アノテーション済文書を時系列に応じて可視化するシステムについて紹介します.

▲第23回(オンライン第1回) 2020-9-28

時間:14:00-15:00

場所:オンライン

講演者:中村 優太 先生(東京大学・NAIST)

題目:BERT匿名化に関して

▲第22回 2019-12-06

時間:15:00-16:00

場所:融合棟1号館4階会議室

講演者:下野 僚子 先生(東京大学)

題目:医療健康分野における質マネジメント

概要:疾病構造の変化、保健医療政策など、外部環境変化にさらされている医療機関では、医療の質の確保がますます重要になっているといえます。医療の質は、患者ニーズ側と医療提供リソース側の適切なマッチングによって確保されますが、実践は容易ではありません。日常業務で取得されるデータや専門職の知見を活かした健康医療分野における業務の質マネジメントの実践例を紹介します。

▲第21回 2019-10-18

時間:15:00-16:00

場所:融合棟1号館4階会議室

講演者:山下 直美 氏(NTT)

題目:Designing Technologies for Mindful Inclusion

概要:To support people with disabilities or specific needs, researchers have tried to understand their disabilities or develop technologies to meet their needs. While this is a promising approach, I propose a different approach, which involves people around them. In most cases, people with disability are overwhelmed by handling their own issues, and people around them are often willing to help, but do not know how because they do not know exactly what the problem is. By increasing the awareness of the problem they are having, technologies may induce mindful inclusion from the surrounding people. In this talk, I discuss the potential/challenge of this approach by introducing a few case studies.

▲第20回 2019-09-06

時間:15:00-16:00

場所:融合棟1号館4階会議室

講演者:矢田 竣太郎 氏(NAIST)

題目:Exploration of data augmentation methods for tweet stance classification

概要:Stance classification (SC) is a type of opinion mining (OM) and requires background knowledge and linguistic understanding, which makes it hard to create high-quality large-volume training data for a new domain. Data augmentation (DA), which generates synthetic data from given data, can alleviate the issue of small training data in practical situations. We applied some of the existing DA techniques for NLP, e.g. paraphrasing and back translation, to tweet SC datasets and compared the effect. Augmented labelled data can improve the scores and stabilises the performance, even if we started from only a couple of hundreds of labelled data. To reach a practical performance instantly in any domains, however, DA methods still have room for improvement too.

▲第19回 2019-02-01

時間:15:00-16:00

場所:融合棟1号館4階会議室

講演者:河添 悦昌 先生(東京大学)

題目:医療分野での人工知能技術の利用と今後の課題

概要:医療へのAI応用が本格化しているなかで、医療画像を対象としたAIは開発が盛んであり、研究から臨床応用、実用化に渡る広い範囲で行われています。一方で、電子カルテに入力・記録される情報は保険請求を主な目的とするため、病名をキーにした症例の抽出すらも十分に行えないという状況であり、AIの更なる活用を目指すためには、正しい臨床病名や正確な臨床情報の入力が行われるような運用のあり方、カルテ記載のあり方が必要であると考えています。

▲第18回 2018-11-09

時間:15:00-16:00

場所:融合棟1号館4階会議室

講演者:梶原 智之 先生(大阪大学)

題目:ニューラル言い換え生成

概要:テキスト平易化やスタイル変換を中心に、言い換え生成の研究動向について紹介します。あわせて、これらのタスクにおける我々の最近の取り組みについても紹介します。



▲第17回 2018-06-20

時間:15:00-16:00

場所:融合棟1号館4階会議室

講演者:小林 亮太 先生(NII)

題目:イベント時系列解析とソーシャルメディアデータ分析への応用

概要:イベント時系列データとは、あるイベントが起きた時刻についてのデータであり、ソーシャルメディア (Twitter, YouTubeなどの履歴)、Web (ホームページへのアクセス履歴)、マーケティング (購買履歴) など分野横断的に見られるデータ形式である。本発表では、イベント時系列についての概要を説明した後、Web、ソーシャルメディア分析 (Popularity prediction problem への応用: Kobayashi and Lambiotte, ICWSM 2016)、社会データ分析 (人間のコミュニケーションデータのモデリング: Aoki et al., PRE 2016) などへの応用事例を紹介する。


▲第16回 2018-03-23

時間:16:00-17:00

場所:融合棟1号館4階会議室

講演者:馬場 雪乃 先生(京都大学)

題目:ヒューマン・コンピュテーションに関する研究紹介

▲第15回 2018-02-15

時間:16:00-17:00

場所:ソーシャル・コンピューティング研究室会議室(融合棟1号館405)

講演者:Panote Siriaraya 先生(京都産業大学)

題目:Game Technology and Gamification for Therapeutic and Elderly care

概要: The discussion would focus on the topic of “Game Technology and Gamification for Therapeutic and Elderly care”. A range of multidisciplinary research projects will be discussed, such as projects involving the use of gamification to enhance mental healthcare therapies, supporting healthy aging through online 3D virtual environments and using gesture based interaction and tangible interfaces to augment virtual world interaction and engage people with Dementia. The central theme of these projects lie in the theoretical and practical demonstration of how game technology and game thinking could be applied to solve real world problems faced in healthcare, often by blending the physical and virtual worlds.



▲第14回 2017-12-01

時間:13:30-15:00

場所:融合棟1号館4階会議室

講演者:榊 剛史 様(ホットリンク)

題目:会話分析の研究手法と態度

概要: 株式会社ホットリンクでは,10年ほど前から自然言語処理・機械学習・社会ネットワーク分析による研究開発を行い,自社のソーシャルメディアデータ分析サービスの機能として活用している.直近はR&Dによる研究開発に力を入れて行く方針であり,リサーチャー・リサーチプログラマの採用や大学との共同研究を積極的に行っていく.本発表では,当社の業務内容やビジョンを説明しつつ,NLP技術をどのように活用することで,「利益を生み出しているか」について事例を通じて紹介する.また,東京近郊でのNLP/AI関連技術を活用している企業を紹介しつつ,当社でリサーチャーとして働くメリット・デメリットを述べる.



▲第13回 2017-09-29

時間:13:30-15:00

場所:ソーシャル・コンピューティング研究室会議室(融合棟1号館405)

講演者:黒嶋 智美 先生(玉川大学 ELFセンター)

題目:会話分析の研究手法と態度

概要:

1. 自己紹介

2. 会話分析の学説論的おはなし

3. 会話分析の手法と研究主題

4. 行為の記述

5. 実習

6. 研究発表例

7. 質疑応答

▲第12回 2017-07-20

時間:17:00-18:30

場所:ソーシャル・コンピューティング研究室会議室(融合棟1号館406)

講演者:莊司 慶行 先生(京都大学 学術情報メディアセンター)

題目:ソーシャルコンピューティングなアプローチによるウェブの検索・分析

概要:ウェブの利用者層と利用用途の拡大に伴い、近年のウェブは、単なる文書集合とは呼べないものになりつつあります。オンラインコミュニケーションのログや、多数の不確かな人々の意見など、単独ではあまり意味を持たない「ソーシャル」なデータの集積体となりつつあるウェブに対して、情報検索やウェブ分析の技術は一体どのようにして向き合ってゆくことができるでしょうか。本発表では、これまでに行ってきた3本の研究と、現在進行中の研究の紹介を通して、

1) ソーシャルメディアの情報と従来のウェブ文書を横断的に検索や分析に利用する、

2) 社会科学や認知科学などの社会的知見を従来のアルゴリズムに組み込む、

という二つの側面から、ソーシャル化の進むウェブをどのように活用してゆくべきかについて議論します。



▲第11回 2017-05-23

時間:17:15-18:00

場所:ソーシャル・コンピューティング研究室会議室(融合棟1号館406)

講演者:畑中 美穂 先生(研究推進機構 研究推進部門・物質創成科学研究科 マテリアルズ・インフォマティクス研究室)

題目:自動反応経路探索を用いる触媒・発光材料の機構解析と機械学習の利用

概要:近年、自動反応経路探索技術の発達に伴い、多くの反応経路のデータが得られるようになった。しかしその反面、データ量が多いために、有用な知見を抽出することが困難になるという問題が生じている。本講演では、触媒反応における分子構造を教師なし学習を用いて効率的に解析した例や多数のランタノイド化合物の消光過程における構造変化のデータから、強発光体の設計に必要な因子を抽出した例を紹介する。



▲第10回 2017-04-21

時間:14:00-15:00

場所:ソーシャル・コンピューティング研究室会議室(融合棟1号館405)

講演者:清水 伸幸 さま(Yahoo! JAPAN研究所)

題目:クラウドソーシングを用いた社会調査の可能性について(仮題)


▲第9回 2017-02-24

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室(融合棟1号館405)

内容:話題提供(伊藤)

概要:依存関係や照応関係からメタファー,メトニミーといった意味の逸脱について見てみたいと思います.言語学に馴染みのない方がほとんどだと思いますが,よろしくお願いいたします.


▲第8回 2016-07-21

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・勉強会のメーリングリスト(名簿)作成継続

・論文紹介(若宮)

Lee JL et al. "What Are Health-Related Users Tweeting? A Qualitative Content Analysis of Health-Related Users and Their Messages on Twitter." J Med Internet Res. 2014 Oct; 16(10): e237 [LINK]


▲第7回 2016-07-07

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・勉強会のメーリングリスト(名簿)作成継続

・論文紹介(磯)

Erez Lieberman et al. "Quantifying the evolutionary dynamics of language." Nature. 449(7163), pp. 713–716 (2007). [LINK]

▲第6回 2016-06-23

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・勉強会のメーリングリスト(名簿)作成継続

・論文紹介(小比田)

Gabriele Oettingen et al. "Pleasure Now, Pain Later: Positive Fantasies About the Future Predict Symptoms of Depression." Psychological Science, pp. 1-9 (2016). [LINK]

▲第5回 2016-06-16

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・勉強会のメーリングリスト(名簿)作成継続

・論文紹介(大村)

Zhou, XueZhong et al. "Human symptoms–disease network." Nature communications 5(4212) (2014). [LINK]

・学会参加報告(荒牧・若宮)


▲第4回 2016-05-31

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・発表練習(荒牧) AI学会招待講演「クラウドソーシングが拓く新たな医学知」, 人工知能学会全国大会 (2016)


▲第3回 2016-05-26

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・勉強会のメーリングリスト(名簿)作成継続

・論文紹介(田中)

Roark, Brian et al. "Spoken language derived measures for detecting mild cognitive impairment." IEEE Transactions on Audio, Speech, and Language Processing, 19.7, pp. 2081-2090 (2011). [LINK]

・教科書「医療言語処理」を用いた研究紹介


▲第2回 2016-05-18

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・勉強会のメーリングリスト(名簿)作成

・論文紹介(若宮)

Prieto VM, Matos S, Álvarez M, Cacheda F, Oliveira JL (2014) "Twitter: A Good Place to Detect Health Conditions." PLoS ONE 9(1): e86191. pp. 1-11, doi: 10.1371/journal.pone.0086191 [LINK]

・教科書「医療言語処理」を用いた研究紹介


▲第1回 2016-05-12

時間:18:30-19:30

場所:ソーシャル・コンピューティング研究室会議室

内容:

・趣旨説明

・教科書「医療言語処理」を用いた研究紹介