特別招待講演20161006
タイトル
Duolingoの大規模データから導き出された効率的な言語習得法
講演者
萩原正人(Duolingo)
概要
国際化が進む現代社会において、外国語の習得はもはや必須のスキルと言える。英語の学習者の数だけでも世界中で合計15億人にも上るという試算もある。語学市場には様々な学習法情報や教材があふれ、英会話学校が活況を呈しているが、個人としてどのように言語を勉強したらよいかという正しい知識はあまり浸透していないのが現状である。なぜ、言語習得に成功する人、そうでない人がいるのか。言語を学んだり、教えたりするにはどのような方法が効率的なのだろうか。
本講演では、これらの疑問に答えるべく、1億5千万人の登録ユーザーを有する世界最大の言語学習プラットフォームである Duolingo (デュオリンゴ) の大規模データを用いて導き出された知見を紹介する。はじめに、CRFを用いたユーザーの誤りモデル構築を通じて、言語の習得を難しくする要因に注目する。次に、言語を継続して学習することに成功しているユーザーに注目し、継続的に言語を学習し続けるために重要な要素を回帰モデルにより分析する。また、忘却モデルの最適化により、間隔反復を用いたユーザーの語彙習得の改善プロジェクトについて述べる。最後に、言語習得に限らず、物事を効率的に習得する最新の心理学に基づいたテクニックを紹介する。
略歴
2009年名古屋大学大学院情報科学研究科博士課程修了。博士 (情報科学)。Google、Microsoft Research、バイドゥ、楽天技術研究所(ニューヨーク)にて、検索エンジンおよび自然言語処理の研究に携わった後、2015 年 2 月より Duolingo にてソフトウェアエンジニア/リサーチサイエンティストとして自然言語処理技術を活かした研究開発に従事。日本語・中国語の解析、機械翻訳・翻字、教育応用などに関心がある。著書に、翔泳社『自然言語処理の基本と技術』(2016)、訳書に、オライリー『入門 自然言語処理』(2010)、『入門 機械学習』(2012) がある。
日時
2016/10/06(木)11:00-12:00
場所
首都大学東京日野キャンパス2号館301号室
(最寄り駅は JR 中央線豊田駅です。南大沢駅ではありません。)
資料
当日の発表の Twitter 実況
発表の資料のスライド (PDF)