投稿日: Nov 19, 2010 10:54:31 PM
フォーマット議論は尽きないと思う方へ
電子書籍を巡っては、交換…中間…閲覧云々いろんなフォーマット名をひいて意見を言う場合が多くなっているが、そもそもフォーマット化は何らかのデータ交換の目的があって行われるものなので、目的の話を曖昧にしてはフォーマット議論は成り立たない。中でも「閲覧フォーマット」とは何を意味するか?PDFも基本は再編集目的ではなくレンダリングだけが目的であるが、閲覧用という呼び方はしなかった。情報処理的にはPDFはPDLであることを参考にすると、プレゼンテーション・ディスクリプション・フォーマットといえる。そこにいくらかインテリジェントな仕様が入るなら、…ランゲージとするのがいいだろう。インテリジェントな要素を入れないでソート済みにして、すばやくレンダリングするものもある。閲覧フォーマットは利用者側から考えてレンダリング用フォーマットでありリードオンリーフォーマットで、今日では情報を必要とする人はネットで入手するので、提供側からみれば配信フォーマットである。このように3つの角度から目的は考えられる。
中間フォーマットというのは情報処理をしている途上のものなので、情報を作る人や受け取る人には関係ない。これは処理をする上での生産性とか品質に係わるもので、中間の処理業者にとっては武器であり独自性が求められる。例えば他のDBとの自動照合でルビつけ・用語チェック・校正などのツールを使って加工度を上げていくためで、そのために中間フォーマットはXML化しておく考えがある。JEPA-Xなどもそういった目的だっただろう。印刷で大規模なデータを扱うカタログなどもそれぞれ独自に情報処理用の中間フォーマットをもっているだろう。電子出版であれWebのECであれ、こういったデータを持たなければ仕事はできないし、競争力になる要素である。新しいITの影響も受けやすい。だから標準化は絶対ありえない分野だ。
交換フォーマットは情報処理が異なる会社とか異なるシステムにまたがって行われる場合に必要になるもので、中間フォーマットと外部インタフェースをとるためにある。XMLでは業界ごとに「何々ML」というボキャブラリーを作ってきたのはそのためであるとも言えるし、GoogleMapのようなWebでのMashUpも小さな交換フォーマットを使っているともいえる。「何々ML」の難しいのは、最初は業界ニーズの汲み上げや、利用のスコープとなる統一したビジネスモデルの策定であって、それは一旦作成して終わりになるものではなく、ビジネスが続く限りメンテナンスして進化させなければならない。それはITや利用環境が変化していくからである。例えばHTML5とか配信フォーマットの進化とか、位置情報の利用拡大とか、また個人情報保護法とか、何が関係して来るかわからない。だからどこかの会社の内部の中間フォーマットを持ち出してきて皆で使う、ということではすまないのである。
こういったことは情報処理プロセスとビジネスプロセスについて、何年か先までにどういう変化が考えられて、実際に何ができるかというビジョンを共有して描く必要があるので、業界団体の出番になる。その業界団体にこれらを考える十分な情報が無い場合が多いので、ステークホルダー達と共同プロジェクトでビジョン策定をするのが一般的だ。これを役所指導でしたものは、役所のバイアスが入ってたいていは失敗する。それは学識経験者とかシンクタンクが役所の指定になったりして、必ずしも業界のことをよく理解していないからである。しかし業界側としてもそのようなやり方は補助金事業とか特別会計であったりと金がついてくるので避けて通れないのだろう。それで役に立たないものを作って、それを業界の中心に据えてしまうと業界の将来は危うい。業界のメンバーが、それぞれのフォーマットの役割をどうするか、どう位置づけるか、悩みぬくのが一番いい結果になるだろう。