実験の手順

実験の手順は，大まかに下の3段階です。

『現代日本語書き言葉均衡コーパス』および『国語研日本語ウェブコーパス』から用例を抽出し，語義と用法別の用例分布を整理し，データセットを作成する。
クラウドソーシングで数千名規模の調査協力者を募集する。調査協力者は，20歳以上のYahoo! Japan ID所有者です。
データセットの用例について，ある1文（指標文）から見てほかの5文（判定文）が似ているかどうかを6段階でチェックしてもらう。

詳細は，以下をご参照ください。

データセット作成の手順

データセットを次の手順で作成しています。

『現代日本語書き言葉均衡コーパス』および『国語研日本語ウェブコーパス』から用例を抽出する。
日本国語大辞典・分類語彙表などから語源と語義を付与する。
述定用法・装定用法・副詞的用法の用法別に分類する。
語義と用法別の用例分布を整理し，データセットを作成する。

語義付与には，このプロジェクトに先駆する研究である山崎・柏野（2017）と加藤ほか（2019）を参照しています。

山崎・柏野（2017）は，分類語彙表の多義語に代表義を付与した研究です。

加藤ほか（2019）は，BCCWJの新聞・書籍・雑誌データの自立語に人手で文脈的に妥当な分類語彙表番号に基づく意味情報を付与しました。

調査では，これらの代表義情報付与済み多義語リストと意味情報付与済み均衡コーパスのデータも援用しました。

クラウドソーシングとは

クラウドソーシングとは，不特定多数の作業者への簡単な仕事の外注です。

Yahoo!クラウドソーシングやランサーズなどのクラウドソーシングサイトで，非常に小さい単位のタスクを数千人規模で依頼できるサービスが提供されています。

大量の語彙・用例に対する大人数のアンケート調査を安価に実施できます（浅原2019）。

不適切な回答の排除

なお，タスクの性質上，実験に協力してもらっている様子を監督できないため，指示文や用例を読まずに回答することが可能です。

このような不適切な回答を排除するために，調査協力の同意確認を兼ね，「同意する」・「同意しない」をランダムに配置したチェック設問を設けました。「同意しない」を選択した回答者は「落選」となり，回答が回収されません。

また，別のタスクで，不適切な回答をする傾向のある回答者をブラックリストにし，回答者の制限もしている。

「落選」した作業者は，語によって異なります。「長い」で5人（回答者数723人），「短い」で3人（回答者数733人）と，1%に満たないことが多いです。

類似度評定の活用

多義語分析の主要な目的は，多義の認定・プロトタイプ的意味の認定・派生関係の解明です。

いずれの手法としても，文法・語彙・論理の観点から言語学的テストが編まれてきました。

ただし，早瀬（2018）に指摘されるように，テストには欠点があります。

適用範囲が限定されたり機能が剛柔であったりと，ただ一つのテストでは妥当性が懸念されることが多いのが実状です。

現状，より妥当な分析に向けて，多様な手法による並列的な検証が必要です。

しかし，言語学的テストは，容認性判断などの違いから研究者に応じて恣意性の高い結論が導かれる可能性があります。

そこで，多義間の類似性評価を活用します。

類似性は，中本ほか（2004）や李ほか（2007）で，多義の認定への活用可能性が論じられています。

また，西内ほか（2020）で用例の双方向評価がプロトタイプ的意味認定の基準になりうることを主張しました。

さらに，類似の認められやすさが多義間の派生関係の分析に援用することも考えられます。

このプロジェクトで提起する評価データベースは，言語学的なテストの4つの問題点を次のように解決できると考えられます。

再調査可能：サービスを利用した不特定多数の作業者への外注なので，研究者の容認性判断や調査協力者群の特性などの違いに関係なく，同じ環境での調査が可能です。
質的な論証を量的に補完：質的な論証で一般性が担保されない場合に，類似性評価の量的データを補完できます。
通時的変遷の可能性の検討：再調査可能な手法を確立することで，時間の経過に応じて多義性が異なっている可能性を検討できます。
統一的な手法：これまでの多義研究では，一つの研究で扱える対象が数語でした。語の特性に応じて分析手法が臨機応変に選択されていたことが一つの要因だと考えられます。類似性評価が量的調査として統一的に機能します。また，大規模調査の計量から，高い再現性での実証が期待されます。

プロトタイプ的意味の認定に向けて

このプロジェクトでは，比較元（指標文）と比較先（判定文）を指定する双方向的な類似度評定を実施し，プロトタイプ的意味の認定に活用することを目指しています。

プロトタイプ的意味とそうでない意味は，基本義と拡張義ともいわれるように，多義間の関係性がその方向性とともに論証されます（Lakoff 1987，Tuggy 1993）。

プロトタイプ的意味から派生義への類似度を認めるときの認知的負荷が反対方向よりも軽いと想定されます。

以上により，プロトタイプ的意味から派生義への類似度が高く，派生義からプロトタイプ的意味への類似度が低くなることを仮説設定できます。

派生義を指標に歴史的意味の起点の意味用法を評定した場合に高い値が得られるとき，現代の直観的プロトタイプが意味拡張の起点と異なっている可能性の検討が必要な事例だと考えられます。

本来，同じ文同士ならば，類似度は同値になることが予想されますが，このプロジェクトでは解釈のプロセスに語義のプロトタイプ性が反映されることを仮定し，双方向性評定を研究手法に取り入れることを提案します。

理論的視座

このプロジェクトでは，ヒトの判定に基づく心理実験的なアプローチをとります。

田中（1987）によれば，文脈に依存しない意味を得るためには，文脈が満たされたデータから帰納的に推測しなければなりません。

ヒトは，通常，単語を文脈から孤立した形で用いないためです。

言語分析の一般的なプロセスは，経験世界の範例であるe（exemplar）をもとに可能世界の理論値E（Exemplar）を推測し，X（カテゴリー）を探る方法です。

この方法は，言語学的なテストによる論証に相当すると考えられます。

対して，このプロジェクトがとる心理実験的な手法では，田中（1987）と同様，私たち一人一人が経験世界で学習したSeをもとにXとEを追究します。

Seもまた，「単語の意味に対する言語的直感を実証的に研究する際のデータ・ベースとなり，また，私たちのX理解のベースになっているものである。」（田中1987: 127）といえます。

（田中（1987）は，多義間の接点を探るコア理論について論じる研究です。コアは，西内ほか（2020）などで研究するプロトタイプ的意味と厳密には異なる概念ですが，同様の心理実験的アプローチが有効と考えられます。）

参考文献

浅原正幸 (2019)「クラウドソーシング結果の可視化手法と統計処理」『日本言語学会第158回大会予稿集』379-384.

加藤祥・浅原正幸・山崎誠 (2019)「分類語彙表番号を付与した『現代日本語書き言葉均衡コーパス』の書籍・新聞・雑誌データ」『日本語の研究』15(2): 134-141.

田中茂範 (1987)「多義語の分析―コアとプロトタイプ―」『茨城大学教養部紀要』19: 123-158.

中本敬子・野澤元・黒田航 (2004)「動詞“襲う”の多義性—カード分類と意味素性評定に基づく検討—」『日本認知心理学会第2回大会発表論文集』38.

西内沙恵・加藤祥・浅原正幸 (2020)「語義間類似度の双方向評定に基づくプロトタイプ的意味の解明―クラウドソーシングを用いた量的調査による多義的形容詞分析―」『日本認知言語学会論文集』20: To Appear.

早瀬尚子 (2018)「言語表現の意味とその指示対象」早瀬尚子 (編)『言語の認知とコミュニケーション－意味論・語用論，認知言語学，社会言語学－』29-44. 開拓社.

山崎誠・柏野和佳子 (2017)「『分類語彙表』の多義語に対する代表義情報のアノテーション」『言語処理学会第23回年次大会発表論文集』302-305.

李在鎬・鈴木幸平・永田由香 (2007)「動詞「流れる」の語形と意味の問題をめぐって」『計量国語学』26(2): 64-74.