Innihaldslaust efni kæfir leitarvélar

Kraðak upplýsinga á vefjum er umfjöllunarefni sem lengi hefur verið eins og „Bleiki fíllinn“ í herberginu þ.e. allir vita af en enginn vill viðurkenna. Eins og fram kom á vef Giraffe fyrir stuttu hefur Andrew Leung, tölvunarfræðingur frá Háskólanum í Kaliforníu skoðað málið ítarlega, en m.a. gerði hann rannsókn á stórum gagnasöfnum yfir þriggja mánaða tímabil og fékk afar áhugaverðar niðurstöður:

  • Meira en 90% af skjölum voru aldrei skoðuð.
  • Af þeim skjölum sem voru skoðuð voru 65% þeirra aðeins skoðuð einu sinni.
  • Megnið af öðrum skjölum voru skoðuð sjaldnar en 5 sinnum.
  • Um tylft skjala voru skoðuð oftar en 100.000 sinnum.

Einnig sýndi rannsóknin fram á að hlutfall efnis/gagna sem sótt var úr kerfinu á móti útgefnu efni/gögnum var um 2 á móti 1. Í fyrri rannsóknum hefur þetta hlutfall verið 4 á móti 1 eða hærra. Þetta þýðir að sá hraði sem við gefum út nýtt efni á móti því sem við erum að sækja eldra efni, hefur aukist.

Leung skoðaði enn fremur gæði leitarvélar á ákveðnum opinberum vef. Þessi stofnun selur fjöldan allan af vörum og hegðun notenda í leitarvélinni endurspeglar það. Hins vegar kom í ljós að þegar leitað var að vinsælustu vörunni, fylltust leitarniðurstöður af tenglum sem vísuðu á fréttir og annað útrunnið efni. Sumir tenglanna leiddu í misvísandi upplýsingar af t.d. vöru sem ekki lengur var til staðar o.s.frv.

Lélegt, óáhugavert efni er að drekkja skilvirkni leitarvéla að mati Leung. Þetta er að gerast æ oftar og á eftir að versna. Þetta á ekki síst við um innri net…sem oft eru eins konar ruslakista fyrir efni sem ekki lengur skiptir máli. Ástæðan fyrir því er m.a. að ekki er til skýr stefna hvað varðar efni og efnistök innan fyrirtækja. Innri net verða því fyrir barðinu á því og enda sem ruslakompur. Við könnumst öll við hversu auðvelt er að leita á þeim ekki satt!

Leung gerist svo djarfur að segja að mikið af því efni og gögnum sem við útbúum sé að mestu gagnslaust og óþarft. Enginn muni hafi áhuga á að skoða það oftar en einu sinni, ef þá svo oft. Því þurfi að geyma þess konar aukaefni sem minna máli skiptir, annars staðar. Hann vill meina að best sé að útbúa aðra síðu með aukaefni en halda aðalsíðunni fyrir aðalefni.

Þetta er áhugaverð hugmynd sem líklegt er að margir muni velta fyrir sér þegar vorhreingerning efnis og gagna á vefjum liggur fyrir! Einnig skiptir þessi hugmynd máli í því árferði sem ríkir nú þar sem peningar eru jafnvel af skornum skammti innan fyrirtækja og því best að nýta það sem fyrir hendi er þannig að skilvirkni náist.