Naslov Arhiviranje weba
Naslov (engleski) Web archiving
Autor Lucija Lučić
Mentor Hrvoje Stančić (mentor)
Član povjerenstva Radovan Vrana (predsjednik povjerenstva)
Član povjerenstva Tomislav Ivanjko (član povjerenstva)
Član povjerenstva Hrvoje Stančić (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Zagrebu Filozofski fakultet (Odsjek za informacijske i komunikacijske znanosti) Zagreb
Datum i država obrane 2020-09-25, Hrvatska
Znanstveno / umjetničko područje, polje i grana DRUŠTVENE ZNANOSTI Informacijske i komunikacijske znanosti Arhivistika i dokumentalistika
Sažetak Diplomski rad bavi se pitanjima arhiviranja web sadržaja. Rad najprije donosi kratak pregled povijesti arhiviranja weba i objašnjenje osnovnih pojmova unutar ove djelatnosti (pobirači, vrste pobiranja, robots.txt datoteke itd.) Zatim se spominju pravni okviri arhiviranja weba koji uključuju smjernice UNESCO-a o očuvanju digitalne baštine te zakon o obveznom primjerku. Navode se najpoznatije svjetske organizacije, usluge i alati arhiviranja weba (Internet Archive, Wayback Machine, Heritrix, Archive-It, IIPC, ARC i WARC formati datoteka, WARCreate, Memento i sl.) Komentira se brz i širok rast inicijativa arhiviranja weba u razdoblju od samo četiri godine. Raspravlja se o važnosti arhiviranja weba za različite svrhe koje mogu uključivati i korištenje arhiviranih web sadržaja u sudskim procesima. Nabrojeni su neki od najčešćih tehničkih i društvenih izazova unutar kompleksne djelatnosti arhiviranja weba (propadanje poveznica, premještanje sadržaja, skriveni web, uklanjanje sadržaja itd.) Navode se primjeri arhiva weba u Hrvatskoj i svijetu (Danska, UK, Francuska i SAD), s naglaskom na Hrvatski arhiv weba (HAW). Uspoređuju se dva različita pobirača unutar HAW-a. Zaključno se ističu inicijative arhiviranja društvenog weba s primjerima iz SAD-a i Kine.
Sažetak (engleski) The thesis discusses the issues of archiving web content. Firstly, a brief overview of web archiving history is presented, as well as the explanations of common terms within this field (crawlers, types of harvesting, robots.txt files etc.) Legal frameworks of web archiving which include UNESCO’s guidelines on preserving digital heritage and legal deposit laws are also elaborated. The most well-known world organizations, services and tools of web archiving are listed (Internet Archive, Wayback Machine, Heritrix, Archive-It, IIPC, ARC and WARC file formats, WARCreate, Memento etc.) The rapid and wide growth of web archiving initiatives during a span of only four years is discussed. The importance of web archiving for different purposes which can include usage of archived web content in court proceedings is pointed out. Some of the most common technical and social challenges within the complex profession of web archiving (link decay, transferring content, hidden web, removal of content etc.) are analysed. Examples of web archives in Croatia and worldwide (Denmark, the UK, France, and USA) are included, with emphasis on the Croatian web archive. Two different crawlers within the archive are compared. In conclusion, initiatives of archiving the social web in the USA and China are illustrated.
Ključne riječi
arhiviranje weba
pobirači
pobiranje
dugoročno očuvanje
arhiv
Ključne riječi (engleski)
web archiving
crawlers
harvesting
long term preservation
archive
Jezik hrvatski
URN:NBN urn:nbn:hr:131:448437
Studijski program Naziv: Informacijske znanosti; smjerovi: Arhivistika, Bibliotekarstvo Smjer: Arhivistika Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: magistar/magistra arhivistike (mag. inf.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Otvoreni pristup
Uvjeti korištenja
Datum i vrijeme pohrane 2020-09-25 12:33:01