Az internet messiásai hajdan azt ígérték a felhasználóknak, hogy gombnyomásra a számítógép monitorára ugrik a keresett információ, és az emberek egerészve lépnek be az információs társadalom korába. Miközben naponta sok százezer oldallal szaporodik az interneten közzétett dokumentumok száma, egyre nagyobb gondot jelent a milliárdnyi oldal átfésülése információmorzsákért, adatokért.
Már a kezdet kezdetén olybá tűnt az interneten elérhető dokumentumok halmaza, mint egy könyvtár könyveinek lapjai, amelyeket kitépkedtek a kötésükből és szétszórtak a könyvtár folyosóin. Napjainkra egy világkönyvtár lapjait kell öszszevadászniuk az információk gyűjtőinek. Immáron a nagy információpublikálók is eljutottak a bőség olyan fázisába, hogy az általuk közzétett anyagok még az ő számukra is nehezen áttekinthetővé lettek. Így az USA kormányának központi web-helye, a www.firstgov.gov olyan keresőmotort épített publikációi mögé, amely percenként 250 ezer oldalt fésül át a keresett szavak, szókapcsolatok után kutatva, ám még ez a tempó is kevésnek tűnik a nagy internetes adathalmok esetében.
Szakértők szerint egyes értelmiségi munkahelyeken dolgozók heti nyolc órát is eltöltenek internetes információk gyűjtésével. Immár évi több milliárd dollárra becsülik az információk felkutatására fordított idő okozta munkahelyi kieséseket. Az információk egybegyűjtését napjainkban mindenki legszívesebben maga végzi, annak ellenére, hogy több ezer cég kínál ilyen szolgáltatást szerte a világon. Ám elutasításuk oka leggyakrabban pszichológiai: az információk után kutató szívesebben böngészik a maga tempója szerint a világhálón; a készen kapott eredmény számára kevésbé értékes; és végül nem szívesen osztja meg a böngészése, keresgélése alatt megszerzett információkat, csupán az azokból leszűrt végeredményt.
Ezért minden nemzet nagy álma, hogy létrehozzon egy olyan internetes könyvtárat, ahol katalogizálják vagy digitálisan közzéteszik a nemzet szellemi termésének színe-javát. Ezek az adatbázisok versenyt futnak az idővel, mind nehezebben birkózva meg a feladattal. A leggyakoribb megoldás ezért olyan részadatbázisok létrehozása, amelyek egy-egy szakma, tudományág internetes termését figyelik, gyűjtik és indexelik, illetőleg intelligens keresőrobotok csak az adott téma oldalait tekintik át. Szakmák, cégek saját maguk számára építenek ilyen részadatbázisokat, s ezek az alapját képezik egy majdani nagy nemzeti gyűjteménynek, illetve az elektronikus kereskedelemben felhasználható és értékesíthető adatvagyonnak.
Az Egyesült Államok legnagyobb látogatható gyűjteménye a Kongresszusi Könyvtár, amelynek katalógusában magyar szerzők százai is fellelhetők az interneten keresztül is. A könyvtár tevékenysége ahhoz kevés, hogy a nyomtatott dokumentumok mellett megőrizze a világhálón publikált írásokat, ezért Internet Archive néven 1996-ban jött létre az a nonprofit szervezet, amely hatalmas háttértárolókra menti le a világháló termését. A digitális könyvtár mára négymilliárd weboldalt, 16 millió usenet üzenetet, 360 dokumentumfilm digitális változatát, valamint 5000 oldalnyi, az internet születésének idején keletkezett iratot gyűjtött össze. Az archívum mérete 40 terrabájt, nagyjából kétszer akkora, amennyi helyet elektronikus formában foglalna a Kongresszusi Könyvtár több évszázados anyaga – adott hírt róla a közelmúltban az Origo. – Az Internet Archive 1996 óta minden második hónapban „lefényképezi” a nagyobb amerikai internetes tartalomszolgáltatók oldalait, és ötévente kicseréli a kiszolgált merevlemezparkot.
Mindez kevésbé boldogítja azt az átlagos internethasználót, aki modemje és számítógépe mellett ücsörögve szorong, felleli-e az információt a weboldalak dzsungelében. Bár minden valamirevaló tartalomszolgáltató működtet keresőrendszereket, ám a legbiztosabb akkor lehet a keresés eredménye, ha több internetes keresőt is munkára fogunk. Mivel erre senkinek sincs elegendő ideje, éppen ezért terjedőben van olyan szoftverek használata, amelyek egyszerre keresnek több, előre meghatározott keresőrendszerben, többféle kulcsszó és szempontrendszer alapján. Így gombnyomásra beállítható, hogy hivatkozás, weboldal, e-mail cím, valamilyen termék, esetleg szolgáltatás után nyomoz-e a felhasználó. S ami jó hír az aggodalmaskodóknak, e szoftverek alapváltozata ingyen van (ilyen például a Copernic 2001 http://www.copernic.com/), s továbbra is csak a keresésre áldozott idő kerül pénzbe. De az internet növekedésével együtt egyre többe.
Népszabadság • 2001. szeptember 4. • Szerző: Dombi Gábor