A07:課題の抽出

課題抽出では、対象公報の利用分野、従来の技術、発明の効果、課題、要約 、発明の名称から課題に関する語句を抽出し、コード化している。

具体的には、「課題code化マクロ」に上記項目を含む対象公報のデータをコピーし、マクロを実行すると、課題コードと課題内容とを含む新たな公報データと、課題コード表が作成される。

保存先アドレス:

https://drive.google.com/drive/u/0/folders/0B4gJnV9TmptlNFVsdlhHSG5waVE?resourcekey=0-X9Hu7LHAjh8Sv3VMrapyNg

※ 現在は「課題code化200409.xls」が最新。


この後は、作成した新たな公報データと、課題コード表を「課題別Graph作成V6.xls」にコピーし、マクロを実行し、各種グラフを作成する。


「課題code化マクロ」の概要は以下のようになっている。

・対象公報の「発明の効果」などのセルデータを読込む。

・課題KW表に設定されたKWがセルデータに含まれているか照合する。

※照合は「発明の効果」、「要約」、「課題」、「利用分野」 、「発明の名称」の順に行ない、コード化に成功すれば、以降の照合は行なわない。

※照合範囲はパターンにより変えている。

パターン1: "本発明は", "本願発明", "この発明", "本発明", "本願"・・・などを含む場合は、次の「。」までを照合対象とする。

パターン2: "効果", "課題", "利点", "有用", "有効な", "改善", "改良"・・・などを含む場合は、前後100文字を照合範囲とする。

パターン3: "実現する。", "目的とする。", "可能になる。", "可能とする。"・・・などを含む場合は、これ以前100文字までを照合範囲とする。

※照合は最長一致法(語長の長いものを優先して照合)を採用している。

※上記でコード化できなかった場合は「従来の技術」も照合対象に追加し、さらに「要約」の先頭から300文字を照合範囲とする。

・読込んだセルデータに含まれている課題KWが有れば、その課題KWに対応する課題コードを抽出し、その課題KWと課題コードを書出す。


課題KW表の構成は以下のとおり。

元の語句1 元の語句2 元の語句3 課題語 課題コード 語長

燃焼 安定 ガスこんろ用バーナ ガスこんろ用バーナ燃焼安定化 J09BAA 13


課題コード表の構成は以下のとおり。

階層1 CD1 階層2 CD2 CD2 階層3CD3 CD3 階層4 CD4 CD4 階層5 CD5 CD5

共通 A - A- - A-- - A--- - A----

A コスト 01 A01 - A01- - A01-- - A01---

※階層の右側のCD2,CD3,CD4,CD5はExcelの演算式が設定してあり、左側の2つのデーを結合してコードを作成している。

例:「A」と「01」から「A01」を作成する。