・問題の所在
『源氏物語』は全54巻のうち第42巻「匂宮」以降の13巻は光源氏没後の物語となります.特に第45巻「橋姫」以降の10巻は宇治十帖と称され,古くは一条兼良(1402-1481)によって著された『花鳥余情』に宇治十帖は紫式部の娘である大弐三位の作であるとする記述があります.つまり,室町時代には『源氏物語』には複数の作者がいるという見解が提起されていました.
・分析方法
『源氏物語』の全文に対して行われた形態素解析データを使用し,各巻における単語の出現率を求め,他作者説を検討するために統計的な分析を行いました.分析に用いた手法は主成分分析やランダムフォレストなどです.
・結論
分析の結果,計量的な判断に基づけば,他作者説を支持する積極的な根拠は認められません.しかし,宇治十帖は他の巻に比べ「こころぼそし」のような「こころ」という語と複合する形容詞や形容動詞が相対的に頻出します.このような点に,宇治十帖が読者に他の巻と異なる印象を与える要因を見いだすことができます.
・書籍
『文学と言語コーパスのマイニング』(金明哲・土山玄 他, 岩波書店, 2021)[詳細]
『計量文献学の射程』(村上征勝・土山玄 他, 勉誠出版, 2016)[詳細]
・Web
夢ナビ 大学教授がキミを学問の世界へナビゲート(土山玄, 株式会社フロムページ, 2025)[Link]
・問題の所在
1人の作家の小説を発表順に何作品も読むと,文体が徐々に変化しているように感じることがあります.人間が徐々に成長することと同様に,作家の文体も発展,あるいは変化することが予想されます.そこで,夏目漱石の小説23作品を採り上げ,文体がどのように変化しているのか分析を行いました.
・分析方法
まず,青空文庫で公開されている夏目漱石の小説をダウンロードし,Web茶まめを使用して形態素解析を行いデータを作成します.次に,単語のn-gramを集計し統計的な分析を行いました.分析に用いた手法は回帰分析,自己組織化マップ,階層的クラスター分析などです.
・結論
分析の結果,夏目漱石は文末表現が継時的に変化していることが明らかになりました.特に,会話文以外の文末において助動詞「た」の出現率が継時的に増加傾向にあり,この助動詞「た」の出現率のみで漱石の小説の出版年をおよそ正確に予測できることを示しました.仮に漱石の未発表の小説が見つかったとすると,いつ頃に執筆された小説であるのか予測することができます.
・Web
夢ナビ講義動画(土山玄, 株式会社フロムページ, 2025)[Link]