Nacionalna sveučilišna knjižnica planira harvestirati sadržaj .hr domene i za ovu godinu, a ukupna veličina dosad prikupljenog i arhiviranog domaćeg weba je 13 TB
Arhiv hrvatskog weba klikom vas vraća u davnu prošlost
Hrvatski arhiv weba zbirka je odabranih sadržaja preuzetih s interneta koji su pohranjeni na serverima Nacionalne i sveučilišne knjižnice, a radi se o projektu kojim se online sadržaj čuva za buduće naraštaje kao dijela hrvatske kulturne baštine.
Sav arhivirani sadržaj može se pretraživati preko naslova, URL-a, ključnih riječi ili predmetnih područja, a dostupan je i preko online kataloga NSK.
Kako bi upotpunili bazu, 2011. i 2012. su proveli dva harvestiranja .hr domene, a u planu je i harvestiranje za ovu godinu. Dosad su proveli i pet tematskih harvestiranja sadržaja vezanih za određenu temu, poput lokalnih izbora, referenduma o EU.
Alat za preuzimanje i ahriviranje sadržaja razvijen je u Sveučilišnom računalnom centru (SRCE), a za harvestiranje se koriste alatom Heritrix, koji je softver otvorenog koda.
Do 2013. godine arhivirano je više od 4900 naslova, a ukupna veličina sadržaja je preko 13 TB.