上田紗世(大阪公立大学),水口毅(大阪公立大学),鈴木岳人(高千穂大学)
複数のテキストの構造を比較するために、文章を構成する単語の出現頻度であるランクを測り、単語列を変換することで得られたランク列に着目した。このランク列を用いて隣接単語の並びを解析し、文章構造の類似性を階層的クラスタリングによって分類した。複数の言語テキストに対していくつかのパラメータを変化させ,分類の性能を定量的に比較・評価した。