役に立たないウエブ情報の増加

インターネット上には種々雑多な情報が存在するが,使える有用な情報が少なくなってきている.

インターネット普及初期の頃は大学生が作成した検索エンジンが利用されていたが,最近は大手ポータルサイトの強力情報収集ロボットが主役を演じている.

自動的にWEBページにアクセスし,情報を収集するのはサーバー上のプログラムであり,一般にロボット,クローラ,スパイダーなどと呼ばれている.

代表的なのはGoogle や Yahooなどの検索エンジンである.これらは,WEBサイトに定期的ににアクセスし,その情報をキャッシュとしてサーバ上に蓄積する.さらに,そのページに含まれるキーワードを抽出し.インデックスを作成している.

WEBサイト上に情報を置くと,ロボットが勝手にやってきて,データベースに登録される.検索エンジンに登録してほしくない場合でもいつの間にか登録されてしまう.

膨大な情報を提供してくれるのはよいが,最近は収集するだけに終わっているのではないかという思いがつよくなった.

そろそろ情報を整理する段階に入ったのではないだろうか.大手の検索サイトが集めたデータも古くなったもの,更新されていないもの,リンク切れのものが数多く見られるようになった.オリジナルデータがない場合はキャッシュがあるからそちらを見ればよいということかも知れないが,それならキャッシュだけにした方がベターではないだろうか.

ロボットは以前収集したデータが更新されているかチェックをしているので,その際ページが存在しない場合やリンク切れは簡単にチェックできるはずである.

検索するキーワードによっては,それに触れた書誌情報だけというのも多い.

グルメ情報などもやらせだったというからそれを信じて出かけて行った人がかわいそうである.

◯◯ナビというデータもいい加減である.頼みもしないのに商店,電話,地図,匠,評判などの視点からデータベースが作成され提供されている.

商店の規模とは関係なく掲載され,商店のホームページがあるのかと思ってしまうような情報の提供がなされている.その商店の最寄り駅などの情報が書かれているが,その記載は交通機関が発達した東京や大阪の感覚で作られているので地方には通用しない.そばに地下鉄などの駅がないのに強引に最寄り駅を探し出しているので滑稽な「行き方」を平気で提供している.薬局の場合,就職サイトにも登録されていて,すぐに求人が掲載されるようになっている.


ウエブ情報はそんなものだよと言ってしまえばそれまでであり,個人の責任でデータを選択すればよいということかもしれないが,納得できない.

以下は実際に経験した話である.


薬局閉店後の経験談

親から引き継いだ薬局を閉局して1年半以上になるが,いまだに商売関連の電話がかかってくる.おそらくネット情報をもとに電話をかけてくるのだろう.

◯X薬局+熊本市でGoogle検索すると,依然として◯X薬局が存在するという大量の情報が存在する.

最初から2ページの検索結果は以下のとおりである.職業別電話番号をもとに作成された,住所,地図表示,最寄りの駅などが登録されている.すべて依頼して掲載してもらったものではない.全国の職業別電話番号帳をデータベースに流し込んだだけなので,下表右欄に示す各項目はほとんど空白である.口コミを書き込む欄などを準備しているところもある.いろいろな情報提供会社が類似のデータベースを競って構築している.

薬剤師会等の公的情報や閉局のメッセージを掲載した独自ホームページ等は種々雑多な関連情報に埋もれてどこにあるのか探すのに苦労する始末である.

すでに,電話も業務用から家庭用に変更したが,商用電話としての情報が山のように存在する.

しかも熊本市は今年4月から政令指定都市になり,中央区が必要になったが,その点もちゃんと修正されたデータも存在する.

これらの膨大なデータの完全消去は不可能に近いと言っても過言ではない.Googleに文句を言っても始まらないので,いちいちデータベース提供会社に連絡をとって消去の依頼をしている.

データベース提供会社は,勝手に作成したためか,削除依頼のボタンを付けているところもある.ところが,どこに連絡してよいのか分からないところも多く,利用者用の「お問い合わせ」に書き込んで対応を待つ必要があるところも多い.後は時間が解決するのを待つしかないようである.(2012/5/21)


追記

平成24年5月21日現在,15社の情報提供会社からデータ削除のメールが届いている.

情報提供会社が削除した場合は,Google等で検索すると該当ページが存在しないとメッセージが返ってくるが,キャッシュは残っている..

Googleなどが収集した当該URLやキャッシュが消去されるまでにはかなりの時間が必要である.