A09:キーワードからの分類構築

分類体系は学術書、インターネットなどに有ればそちらを参照するのが良いが、適当なものが無ければ新たに構築するしかない。

この場合でも、特許分類に近いものが有れば、これをベースに項目を追加したり、逆に削除して、調査テーマに沿った分類体系を作成できることが多い。

しかし、これさえも無い場合には、全く新たに作成するしかない。

このようなケースのときは、公報中のキーワードを調べて分類体系を構築しており、その方法を以下に説明する。

テーマは「車両の自動運転技術」であったが、探し方が悪かったか、適当な分類体系が見つからなかった。

そこで、予備的な調査でサンプル公報を検索し、この公報の発明の名称と要約から自動運転にとって必須と思われる技術項目を抽出し、これを整理して分類体系を作成した。

具体的には以下のようにして分類体系を作成した。

・サンプル公報の発明の名称と要約から自動運転にとって必須と思われる技術項目をキーワードとして抽出する。このキーワードは単独のものと、A*Bのように2つのキーワードをANDで結合したものも含んでいる。

・抽出したキーワードを仕分けし、いくつかのグループに分ける。ただし、この段階では分類の骨格となる大分類を作成しただけである。

・次に、実際の母集合(分析対象公報)から上記骨格の分類に対応するキーワードを含む公報をNOT演算で除外する。

・残った公報の発明の名称と要約から上記と同様にしてキーワードを抽出し、そのキーワードを含む公報をNOY演算で除外する。また、ここで判明した調査テーマ外の公報も除外する。

・このキーワード抽出とNOT演算を繰り返し、追加すべきキーワードがなくなった時点でキーワード抽出を終了する。

・このようにして抽出したキーワードを再び仕分けし、上位項目にまとめられれば上位項目を作成し、その下位に属するキーワードを集める。また、これまでの分類体系に含まれない項目が出てきたら、新たな大分類を追加し、そこに分類する。

・このようにして、キーワードの仕分けが終了したら、大分類の並び順を検討し、大分類単位でキーワードを並び変える。

・次に、上から順にコードを付与する。

このとき、大分類はA,B,C・・・、中分類は01,02,03・・・、小分類はA,B,C・・・、細分類は01,02,03・・・を付与した。つまり四階層六桁のコードを付与した。

また、キーワードが異なっても分類として同じであると判断した場合には同じコードを付与している。

したがって、1つのコードに複数のキーワードが存在することが普通である。

このようにして作成したコードとキーワードとの対照表はコード変換表として利用する。

具体的には、このコード変換表を用いて、公報の発明の名称と要約と照合を行ない、一致すればコードを付与している。

また、1つのコードに複数のキーワードが有れば、その重複を除去し、コードの名称に修正し、コード表を作成する。

車両自動運転技術の調査では、上記のようにして、公報の発明の名称と要約からコード体系を構築し、コード変換表とコード表を作成した。この方法では同時にノイズ公報もあらかた除去できるので、分類構築を行なう1つの有効な方法であると考えている。