Archivace internetu

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Archivace internetu je proces sbírání části obsahu internetu a zajištění, že sbírané objekty jsou dlouhodobě uchovávány a zpřístupňovány pro budoucí badatele, historiky a veřejnost. Archivování internetu se obvykle provádí automaticky pomocí robotu (web crawlers). Největší institucí, která se archivací internetu zabývá je Internet Archive, v česku WebArchiv.

Sběr webu

Archivují se obvykle všechny součásti obsahu internetu, včetně HTML, stylů CSS, JavaScriptu, digitálních obrázků a multimediálních souborů. Také se skladují metadata související s těmito objekty, jako jsou informace o tom, kdy byl objekt získán, jakého je typu, jakou technologií byl sklizen, jak je velký atp. +more Metadata jsou důležitá pro určení autenticity a původnosti dat.

Nejčastěji se internet sbírá pomocí robotů, které vidí stránky podobně jako uživatel. Používané roboty jsou například:

* BRJBot * Heritrix * HTTrack * [url=http://www.metaproducts.com/mp/Offline_Explorer_Enterprise.htm]Offline Explorer[/url]

Externí odkazy

[url=http://www. netpreserve. +moreorg/]International Internet Preservation Consortium (IIPC)[/url] - * [url=https://web. archive. org/web/20080802201629/http://www. iwaw. net/]International Web Archiving Workshop (IWAW)[/url] * [url=http://www. loc. gov/webcapture/]Library of Congress, Web Capture[/url] * [url=http://www. ifs. tuwien. ac. at/~aola/links/WebArchiving. html]Web archiving bibliography[/url] * [url=http://www. webarchivist. org/]WebArchivist[/url] * Projekty: ** [url=http://govinfo. library. unt. edu/]CyberCemetery[/url] ** [url=http://www. sino. uni-heidelberg. de/dachs/]Digital Archive of Chinese Studies[/url] ** [url=https://web. archive. org/web/20101004182419/http://internetmemory. org/]Internet Memory Foundation (dříve European Archive Foundation)[/url] ** [url=http://www. hanzoarchives. com/]Hanzo Archives[/url] ** [url=http://www. archive. org/]Internet Archive[/url] ** [url=http://archive. pt]Portuguese Web Archive[/url] ** [url=http://archive. is]On-demand Web Archiver[/url] ** [url=http://www. digitalpreservation. gov]The Library of Congress, National Digital Information Infrastructure and Preservation Program[/url] ** [url=http://www. webarchive. org. uk/]UK Web Archiving Consortium[/url] ** [url=https://web. archive. org/web/20190421002933/http://archivujem. cz/]Archivujem. cz - Archiv skončené inzerce[/url].

Kategorie:Internet Kategorie:Archivy Kategorie:Digitální knihovny

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top