To je to što me zanima!

Arhiv hrvatskog weba klikom vas vraća u davnu prošlost

Nacionalna sveučilišna knjižnica planira harvestirati sadržaj .hr domene i za ovu godinu, a ukupna veličina dosad prikupljenog i arhiviranog domaćeg weba je 13 TB
Vidi originalni članak

Hrvatski arhiv weba zbirka je odabranih sadržaja preuzetih s interneta koji su pohranjeni na serverima Nacionalne i sveučilišne knjižnice, a radi se o projektu kojim se online sadržaj čuva za buduće naraštaje kao dijela hrvatske kulturne baštine. 

Sav arhivirani sadržaj može se pretraživati preko naslova, URL-a, ključnih riječi ili predmetnih područja, a dostupan je i preko online kataloga NSK. 

Kako bi upotpunili bazu, 2011. i 2012. su proveli dva harvestiranja .hr domene, a u planu je i harvestiranje za ovu godinu. Dosad su proveli i pet tematskih harvestiranja sadržaja vezanih za određenu temu, poput lokalnih izbora, referenduma o EU. 

Alat za preuzimanje i ahriviranje sadržaja razvijen je u Sveučilišnom računalnom centru (SRCE), a za harvestiranje se koriste alatom Heritrix, koji je softver otvorenog koda. 

Do 2013. godine arhivirano je više od 4900 naslova, a ukupna veličina sadržaja je preko 13 TB.

Idi na 24sata

Komentari 4

  • strmi007 27.10.2013.

    Zanimljivo

  • kampod 26.10.2013.

    čak 13 tb... woow... meni treba nešto dulje od godine dana da preuzmem i pregledam 13 tb podataka... otprilike godinu i pol...

  • janjac 25.10.2013.

    ne valja niš: ukucal sam tri pojma i niš nije našel...fufa, tapir & frnjokl...beskorisna stranica, pih....(cinicus filozoficus)

Komentiraj...
Vidi sve komentare