投稿日: Sep 24, 2013 12:41:15 AM
ザンネンなビッグデータ
ビッグデータ時代に個人情報が守られるかどうかと心配する人が居る。私の場合は名前の漢字のちょっとした違いの人は中学の時に居たが、完全な同姓同名の人とはリアルの世界では会った事が無かった。ところがネットの時代になって10数年前に検索するとIT関係であと2人居ることが判った。今は検索するともっと居ることが判る。
そしてSPYSEEのような人のプロフィールやつながりを調べるサイトは混乱している。昔はSPYSEEは自分で見ても正しい関係が表示されているほうが間違った表示よりも多かったのだが、近年では逆でウソの方が圧倒的に多くなっている。この理由のひとつは同姓同名の判別が出来ていないからではないかと推測する。
SPYSEEに限らず、海外も含めて個人のプロフィールを整理しているサイトやサービスはだいたい役に立たない情報で満ちていて、今まで見たところではやはりGoogleがもっともそれらしい整理をしていた。しかしこれが個人情報を侵害するようなものではないので、今のところはあまり心配するようなものではない。というのは以前から「名簿屋」を使ってDMが出されていたのとそんなにレベルは変わっていないからである。
そしてビッグデータ時代にネットにある情報をロボットがクロールして、もっと精度の高い個人プロフィールを整理できるかというと、SPYSEEのように逆ではないかな、と思う。その理由はネットの性質として広範囲に情報を集めるので、全然縁もゆかりも無い人のデータを一緒にしがちだからだ。例えば九州でしか活動していない人と同姓同名の人が北海道に居ても、通常はその2人を混同することはないが、ネット上の情報は必ずしもその人の居所がわかるわけではないから情報を混ぜ合わせてしまう可能性が高い。
だからカード会社・共通ポイントなど、最初から名寄せ管理している情報と、名寄せ管理していない他のデータ群を混ぜ合わせると、おそらく情報の信頼性はどんどん下がっていくだろう。先般アドテック東京2013というデジタルマーケティングのイベントが行われて盛況だったらしいが、ビッグデータという新しい言葉を使っても、昔のデータマイニングから此の方、IT屋にマーケ屋が騙されることの延長に陥る危険性は高い。まあマーケティングという行為自体が欲に駆られて行われるものだから、仕方がないのかもしれないが。