その他
『発話文へのキャラクタ重畳』
『発話文へのキャラクタ重畳』
私たちは、誰かが発話した文(以下、発話文)から、発話を行った人(以下、発話者)がどんな人物であるかを推測できることが多いです。たとえば、「俺は知ってるぞ」という文からは、発話者の性別が男性であるということが推測できます。
このような発話者の特徴と強い関係性を持つ文のことを、私たちはキャラクタ性を持つ文と呼んでいます。本研究は、これらの文を自動で生成するシステムの開発を目指しています。
現在は、文のどこをどのように変えれば、キャラクタ性を持つ文を生成する事ができるかということを調査しています。
『外国人名カタカナ表記標準化・統一化』
『外国人名カタカナ表記標準化・統一化』
現在、報道 (放送・新聞) におけるカタカナ表記は十分に統制されておらず、同一の人物に異なるカタカナ表記が割り当てられることも珍しくありません。これは、同一人物を別人物と見なしてしまう危険性が強く、報道の観点から望ましいとは言えません。本研究では、
(1) 過去の既約が存在する場合はそれに従う
(2)既約が存在しない場合は性別や国籍などを考慮した標準的なカタカナ役を付与する
上記の2点により外国人名カタカナ表記の標準化・統一化を目指します。
2020年の東京オリンピックでは、多くの外国人選手を報道することが予想されます。本研究では、東京オリンピックでの報道の現場での実運用を想定 し、プロトタイプシステムを作成することを通して、解くべき問題の洗い出しと支援システムのあり方などについて検討を行います。
現在は、30万件の人名データを用いて、どのような規則や傾向があるのかとういうことを調査研究を行っています。