Tražili ste članak iz 2013. i ne možete ga pronaći? Možda je nestao s interneta. Prema istraživanju Pew Research Centra, gotovo 40% web stranica stvorenih te godine više nije dostupno zbog “digitalnog propadanja”. Ova analiza pokazuje koliko je online sadržaj zapravo prolazan. Digitalno propadanje odnosi se na postupno propadanje, oštećenje ili zastarjelost digitalnih informacija s vremenom.
Opseg problema
Prema rezultatima istraživanja, 38% sadržaja koji je postojao 2013. danas više nije dostupno. Proširenjem analize na razdoblje od 2013. do 2023., otkriveno je da je četvrtina svih web stranica iz tog perioda sada nedostupna. Najčešći razlog je brisanje ili uklanjanje stranica s funkcionalnih web stranica.
Definicija “nedostupno” uključuje stranice koje više nisu na host serveru, što obično rezultira porukama o grešci poput 404. Istraživači su koristili nasumične uzorke od gotovo milijun web stranica iz Common Crawl arhiva, gdje se povremeno prikupljaju snimke interneta. Analiza je obuhvatila godine od 2013. do 2023. i pokazala da oko 25% stranica stvorenih u tom periodu više nije bilo dostupno u listopadu 2023.
Različite vrste web stranica
Analiza je također otkrila zanimljive razlike među različitim vrstama web stranica. Primjerice, od 50.000 stranica na engleskoj Wikipediji, 82% ih je imalo barem jednu referentnu poveznicu na vanjske stranice, ali 11% tih referenci više nije dostupno. Na oko 2% uzorkovanih stranica sve su poveznice bile nefunkcionalne, dok je 53% imalo barem jednu pokvarenu poveznicu.
Web stranice američke vlade nisu izuzetak. Od uzorkovanih 500.000 stranica, tri četvrtine su imale barem jednu poveznicu. Prosječna stranica imala je 50 poveznica, a mnoge su vodile na sigurne HTTP stranice. No, 21% vladinih stranica imalo je barem jednu pokvarenu poveznicu, a gradske uprave bile su najgori prekršitelji.
Novinske stranice i društvene mreže
Novinske stranice također nisu imune na ovaj problem. U uzorku su istraživači otkrili da 94% stranica ima barem jednu poveznicu koja vodi čitatelje izvan web stranice. Prosječna stranica imala je oko 20 poveznica, dok su stranice u gornjih 10% imale oko 56 poveznica. Oko 5% poveznica na novinskim stranicama sada je nedostupno, a 23% svih stranica imalo je barem jednu pokvarenu poveznicu.
Na Twitteru (sada X), od 5 milijuna tweetova objavljenih između ožujka 2013. i 2023., 18% više nije dostupno. Najčešći razlog je što su računi koji su objavili tweetove postali privatni, suspendirani ili izbrisani. Tweetovi na određenim jezicima, poput turskog i arapskog, posebno su skloni nestajanju.
Izvješće je objavljeno na web stranici Pew Research Centra i nudi uvid u prolaznost digitalnog svijeta.