投稿日: Oct 12, 2011 12:23:57 AM
検索結果が多すぎると思う方へ
HTML5の陰に隠れて霞んでしまったものに、2005年くらいに話題になったセマンティックWebがある。これはWebがこれから進む道筋を示したもので、URI、XML、RDFなどの技術をひとつづつ重ねることで、コンピュータが意味を理解して、自動に処理できるようにと考えられたものである。しかし現実にはRSSに使われるRDFとオントロジーのOWLの技術仕様はW3Cで確定されたが、その先はどうなったのか知らない。現実社会の要求としてはHTML5のようなマルチメディア指向で、Webの表現力を高めることが優先された。
セマンティックWebの考え方は消えてなくなるようなものではないが、努力の割りに実利がないので、ビジネス的には取り組まれなくなったのだろう。つまり研究テーマとしては残るものの、W3Cの技術仕様に依存するのではなく、そういった要素が必要な人にとって実現可能な方法で、地道に開発が続けられることになる。例えばデータ処理がXMLの技術の延長上に行われるのではなく、既存のSQLであったりVBであったり、他の自然言語処理であったりなど異なる方法で、狙いとしてはセマンティックなWebが増えていく方向である。要するにすべてをピュアにXML技術の上でしなければならないのでなければ、進めようはある。
Webの時代でもっとも大きく育った企業がGoogleであるように、サーチというニーズが非常に大きいということが、世界中のWebサーバをチェックすることが実現可能になってからわかった。Googleは地図でも図書館の本でも放送番組でも、人が探索するものはすべてサーチ可能にする目標を掲げていて、まだ当面やるべき仕事は無くならない。しかしGoogleがすることがWebの未来のすべてではないことを思い出させてくれるのが、セマンティックなWebなのである。誰でも経験するようにサーチの結果がたくさん有り過ぎるのは有難くはない。たとえ結果が探し求める文脈に合っていても、人はその中からもっとも信頼のできるものとかに、さらに絞り込みたい。つまりセマンティックWebの考え方で行くとオントロジーの先にある Logic Proof Trust に至る開発目標がある。
現状ではデータの信頼性の証明などはWebの技術とは関係なく、ローカルな処理であるが、編集における校閲・校正作業のように日常的に行われている。一部セマンティックWebに近いものでは文化人・有名人の生没年照合とか、コンプライアンス上の用語チェックなどはクラウド化に進んでいるかもしれない。かつてはすべてがローカルにデータベースを作って自分で処理すべきものであったのが、どこでも同じようなことをしている用途はクラウドでシェアする方向に進むだろう。その時に個別のルールでは運用できずに、もう一度セマンティックWebのような技術仕様が見直されるのではないだろうか。
しかし先にそのような技術仕様を作って、それに体を合わせろ、というのは無理がある。まずは身の回りのルーチンワークのアルゴリズム化、ツール化という努力が積み重ねられないと、技術仕様も使いやすいものにはならないだろう。