Archivace internetu
Author
Albert FloresArchivace internetu je proces sbírání části obsahu internetu a zajištění, že sbírané objekty jsou dlouhodobě uchovávány a zpřístupňovány pro budoucí badatele, historiky a veřejnost. Archivování internetu se obvykle provádí automaticky pomocí robotu (web crawlers). Největší institucí, která se archivací internetu zabývá je Internet Archive, v česku WebArchiv.
Sběr webu
Archivují se obvykle všechny součásti obsahu internetu, včetně HTML, stylů CSS, JavaScriptu, digitálních obrázků a multimediálních souborů. Také se skladují metadata související s těmito objekty, jako jsou informace o tom, kdy byl objekt získán, jakého je typu, jakou technologií byl sklizen, jak je velký atp. +more Metadata jsou důležitá pro určení autenticity a původnosti dat.
Nejčastěji se internet sbírá pomocí robotů, které vidí stránky podobně jako uživatel. Používané roboty jsou například:
* BRJBot * Heritrix * HTTrack * [url=http://www.metaproducts.com/mp/Offline_Explorer_Enterprise.htm]Offline Explorer[/url]
Související články
WebArchiv * Internet Archive * Archiv * Internet * Metadata * Digitální knihovna * Digitální repozitář * DigitalPreservationEurope
Externí odkazy
[url=http://www. netpreserve. +moreorg/]International Internet Preservation Consortium (IIPC)[/url] - * [url=https://web. archive. org/web/20080802201629/http://www. iwaw. net/]International Web Archiving Workshop (IWAW)[/url] * [url=http://www. loc. gov/webcapture/]Library of Congress, Web Capture[/url] * [url=http://www. ifs. tuwien. ac. at/~aola/links/WebArchiving. html]Web archiving bibliography[/url] * [url=http://www. webarchivist. org/]WebArchivist[/url] * Projekty: ** [url=http://govinfo. library. unt. edu/]CyberCemetery[/url] ** [url=http://www. sino. uni-heidelberg. de/dachs/]Digital Archive of Chinese Studies[/url] ** [url=https://web. archive. org/web/20101004182419/http://internetmemory. org/]Internet Memory Foundation (dříve European Archive Foundation)[/url] ** [url=http://www. hanzoarchives. com/]Hanzo Archives[/url] ** [url=http://www. archive. org/]Internet Archive[/url] ** [url=http://archive. pt]Portuguese Web Archive[/url] ** [url=http://archive. is]On-demand Web Archiver[/url] ** [url=http://www. digitalpreservation. gov]The Library of Congress, National Digital Information Infrastructure and Preservation Program[/url] ** [url=http://www. webarchive. org. uk/]UK Web Archiving Consortium[/url] ** [url=https://web. archive. org/web/20190421002933/http://archivujem. cz/]Archivujem. cz - Archiv skončené inzerce[/url].
Kategorie:Internet Kategorie:Archivy Kategorie:Digitální knihovny