今年(2021年)は特許情報分析の自動化に取り組んでいる。
具体的には、機械学習で利用されているpythonにより、コード化、集計、グラフ化、コメント生成、レポート作成までをワンクリックで完了することができるようになった。
この自動化により、公報データをCSVファイルに保存し、テーマ名と調査目的を設定しておけば、5分〜20分程度で、100ページ(100程度の図表を含む)程度のレポートが生成できるようになった。
これまで、単一テーマ(9テーマ)、複合テーマ(2テーマ)、特定出願人(34社)、グループ分析(主要14大学)についてテストし、デバッグはほぼ完了した。
しかし、図表中の文字位置、文字の大きさはパラメータの設定により対応しており、上記テストデータ以外のデータに対しても違和感の無い図表を生成できるように、パラメータを修正し続ける必要がありそうである。
また、コメント作成についても判定ルールにまだ不備があるかもしれないが、今後はこれらの分析ツールを実際に使用しながら改善していく予定である。
上記のとおり、pythonは強力なツールであり、かつ、windowsでもmacでも無料で利用できるので、今後もpythonを利用して分析方法を改良する予定である。
具体的には、今回開発した基本的な分析ツールを利用して、技術の変遷、企業価値との連関などを分析する予定である。
なお、pythonを使用する人はまだ少ないようですので、Excelマクロによる分析方法の説明は残しておきます。ただし、Excelマクロを含む状態でExcel bookを保存・読み出しができなくなったので、実際に使用していたツールは残っていません。