互联网中存在着这么一个档案馆:Internet Archive ,里面保存着互联网中上万亿的资料,其中包含网页,图片,视频等多媒体项目。
维基百科中是这么介绍 Internet Archive 的:
互联网档案馆(英语:Internet Archive)是美国的一个非营利性的、提供互联网多媒体资料文件阅览服务的数字图书馆。互联网档案馆由Alexa创始人布鲁斯特·卡利于1996年创办,总部位于加利福尼亚州旧金山的列治文区,其使命是“普及所有知识”(英语:universal access to all knowledge.)。该网站提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。 迄至2021年2月,该网站存储了7280 亿个网页、3800万本书和文本、1400 万个录音(包括 240,000 场现场音乐会)、700 万个视频(包括 200 万个电视新闻节目)、400 万张图片、790,000 个软件程序。除此之外,互联网档案馆也是网络开放与自由化的倡议者之一。
互联网档案馆中,最出名的功能莫属于Wayback Machine(互联网时光机)了。
Wayback Machine可以查看互联网上绝大多数网页的历史备份与记录,其均保存了一份网页的快照。为了兼容现在早已全面停用但古早网站喜欢使用的Flash技术,Wayback Machine还特别提供了插件兼容,使用户无需安装Flash即可看到Flash动画,可谓是非常贴心了。
但是,Wayback Machine的快照功能极其有限,且随着时间的推移,很多旧快照出现了不同程度的问题,例如无法正确查看,或者有很奇怪的BUG等问题。Wayback Machine无法保证所有网站都在里面,只有访问量大的网站,或者主动提交了的网站才会被收录进去。一旦网站被收录,其爬虫会不定期的自动爬取网站内容,爬取间隔为几天甚至几个月都有可能。
Wayback Machine中的内容均收集自互联网,其不做审查处理,故导致在某些其他地区无法正常访问。如您需要访问Wayback Machine,但您在上述的其他地区中,可能需要您自行做技术手段后方可正常访问。
请访问互联网档案馆的Wayback Machine,自由探索互联网的历史吧!
Wayback Machine https://archive.org/web/
文章评论