クックパッドだけでも300万件のレシピが掲載されており、日本は世界に名だたるレシピ大国です。ですが多ければいいというわけではなく、「肉じゃが」を検索すると1万件以上のレシピがみつかることから、調理手順説明文の意味理解を行うことが重要です。レシピは料理を作る工程を記した手順文書ですから、一般的な文書と異なり、明確な構造をもちます。我々は自然言語処理技術によりレシピテキストから作業のフローグラフを抽出(右上図)し、異なるレシピ間の相違を自動的に抽出することで、「手順文書」に注目したレシピ検索・推薦システムを開発しています。
我々はレシピ文書の意味を構造的に理解することを目的として、京都大学 森信介研究室と共同でレシピの自然言語処理ツールの開発を行っています。詳しくは以下をご覧ください。
フローグラフに変換されたレシピは様々な使い道があります。その一つがレシピ間の相違を見つけることです。我々は2つの異なるグラフ間の類似や相違を見つけ出すために、片方のレシピをもう片方のレシピにするために必要な編集作業が最小となるようノード間を対応付ける編集距離最小マッピングを利用しました。