A01:コーディング方法

コーディング

特許情報を分析するためには、まず各公報にコードを付与する必要がある。

コードを付与する方法、すなわちコーディングを行なうには、まず分類項目を体系化し、この体系化した分類項目にA,B,C・・・などのコードを割り当てる。

次に各公報にこのコードを付与していくが、オーソドックスな方法としては各公報を読み込み、内容を把握し、コードを付与する方法がある。

この方法は正確ではあるが極めて時間を要する。例えば、1万件の公報を1日に100件ずつコーディングした場合、100日かかる。

このような方法ではタイムリーに分析することはできないし、外注すると数百万円かかるので、よほどの覚悟が無いとできない。

そこで、私は精度は犠牲にしてもっと簡易な方法をとることにした。

代表的な方法は、公報に付与された特許分類をそのまま分析項目とする方法である。

この場合には、特許分類を集計するだけであるので極めて簡単であり、手軽に分析できる。

しかし、特許分類はその特許分類を作成したときに考えた1つの観点であるので、今回分析したいテーマに合うように分類されていることはまれである。

このような理由から、私は以下の方法の1つまたは複数を組み合わせてコーディングを行なっている。

A:コード毎に検索式を作成し、検索結果をそのまま、あるいはノイズを除いて検索結果の公報全体に同じコードを付与する。

B:分類項目として適切なIPC、FI、Fタームが見つかれば、その特許分類を調査テーマの分類項目に沿って編成し直し、特許分類と調査テーマの分類項目との対照表を作成し、この対照表にしたがって特許分類をコードに変換する。

C:「発明の名称」や「要約」に含まれている語句を調査テーマの分類項目(および関連語句)によりキーワード検索し、特許分類と調査テーマの分類項目との対照表を作成し、この対照表にしたがって特許分類をコードに変換する。

D:出現頻度の高い2つの特許分類のペア(共起分類)を1つの分類とみなしてコード化する。

いずれの方法をとるかはケース・バイ・ケースであるが、例えば、以下のように使い分けている。

1.「再生可能エネルギーによる発電方式」のように、方式別の場合は各方式をサブテーマとし、各サブテーマを検索する検索式を作成し、検索結果の公報にサブテーマのコードを付与する。

2.分類項目別に検索できない場合またはさらに細かく分類したい場合にはまず特許分類が利用できるか検討する。

例えば、IPCに適切な分類が有ればIPCを使用するが、IPCでは分類項目が不足することがある。

この場合にはまず適切なFIが無いか調べる。

適切なFIが無ければ適切なFタームが無いか調べる。

このようにして利用できる特許分類が見つかれば特許分類を調査テーマの分類項目に沿って編成し直し、特許分類と調査テーマの分類項目との対照表を作成し、この対照表にしたがって特許分類をコードに変換する。

このように、対照表で特許分類をコードに変換する方法をとれば、複数の特許分類をまとめて同じコードを付与できるので、特許分類をベースとしているものの別の分類体系を作成することができる。

3.上記1または2の方法をとれない場合、またはコード化できなかった公報が多かった場合には、キーワードによりコード化する。

実際の作業としては次の作業を繰り返してコード変換に使用するキーワードを抽出し、このキーワードとコードとの対照表を作成し、この対照表にしたがって特許分類をコードに変換する。

・公報を見て目立っているキーワードを抽出する。

・このキーワードにより検索を行なう。

・検索後に残った公報を見て目立っているキーワードを抽出する。

4.上記1〜3の方法をとれない場合、または補助的に一部の公報についてコード化したい場合は次の方法によりコード化する。

・IPCのサブクラスを四桁三階層のコードに見立てて分析対象公報のIPCをコード化する。

※IPCをそのままコード化するとコード数が多くなりすぎるのでサブクラスでコード化している。

・共起確率の高さにより分類し、コード化を行なう。