关注“数字衰减”:2013年时存在的网页有38%在十年后已无法访问

2024年05月19日 18:18 次阅读 稿源:cnBeta.COM 条评论

互联网是现代生活中难以想象的巨大宝库,拥有数千亿个索引网页。但是,即使全世界的用户都依赖网络来获取书籍、图片、新闻报道和其他资源,这些内容有时也会从人们的视线中消失。

皮尤研究中心(Pew Research Center)的一项最新分析表明,网络内容实际上是多么稍纵即逝:

截至2023年 10 月,2013 年至 2023 年间一度存在的所有网页中,有四分之一已无法访问。在大多数情况下,这是因为在原本正常运行的网站上删除或移除了个别网页。

pl_2024.05.17_link-rot_0_01.webp

对于较早的内容,这一趋势更为明显。在 2013 年存在的网页中,约有 38% 如今已不可用,而在 2023 年存在的网页中,这一比例仅为 8%。

这种"数字衰减"发生在许多不同的网络空间。我们研究了截至 2023 年春季出现在政府网站、新闻网站以及维基百科页面"参考文献"部分的链接。

分析发现:

23% 的新闻网页包含至少一个断开的链接,21% 的政府网站网页也是如此。网站流量大的新闻网站和流量小的新闻网站出现链接中断的可能性差不多。地方一级的政府网页(属于市政府的网页)尤其容易出现链接断开的情况。

54% 的维基百科页面的"参考资料"部分至少包含一个指向已不存在的页面的链接。

为了了解数字衰减在社交媒体上的表现,Pew还收集了 2023 年春季社交媒体平台 X(当时名为 Twitter)上的实时推文样本,并对其进行了为期三个月的跟踪。结果发现:

近五分之一的推文在发布数月后就不再在网站上公开可见。其中 60%的情况是,最初发布推文的账户被设为私有、暂停或完全删除。另外 40% 的情况是,账户持有人删除了单条推文,但账户本身仍然存在。

某些类型的推文往往比其他类型的推文更容易消失。 超过 40% 的土耳其语或阿拉伯语推文在发布后三个月内就在网站上消失了。使用默认个人资料设置的账户所发的推文尤其容易从公众视野中消失。

pl_2024.05.17_link-rot_0_02.webppl_2024.05.17_link-rot_0_05.webppl_2024.05.17_link-rot_0_03.webppl_2024.05.17_link-rot_0_04.webp

对文章打分

关注“数字衰减”:2013年时存在的网页有38%在十年后已无法访问

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan