一家自称拥有全球最大恶意软件源代码收藏的研究团队 vx-underground 近日在社交平台 X 发帖称,其当前保存的恶意软件数据总量约为 30 TB(太字节)。不久后,在线多引擎病毒扫描服务 VirusTotal 创始人 Bernardo Quintero 在回复中表示,用户多年来提交到 VirusTotal 的恶意软件样本已经累计达到约 31 PB(拍字节)。按照常用换算,一拍字节约等于一千太字节,这意味着两者的数据规模已远超一般用户的直观想象。

网络安全公司、人工智能研究人员和威胁情报机构普遍将这类恶意软件样本库视作关键基础数据,用于训练检测模型、研究攻击技术演化路径和分析新型威胁。然而,当这些规模动辄以 TB、PB 计的数据被抽象成数字时,它们具体“有多大”,往往很难在物理世界找到参照。因此,有人提出了一个颇具画面感的问题:如果把这些数据都存进传统硬盘,一块块叠起来,这些“恶意软件银行”究竟能堆多高?又能和现实世界的标志性建筑形成怎样的对比?
TechCrunch 记者在编辑部里曾尝试向某款 AI 聊天机器人抛出这一问题,但得到的答案“离谱到不可信”,最后只得放弃。于是,编辑团队改用最直接的方式——拿出纸笔,按常识做了一番“餐巾纸背面的粗略计算”。考虑到 vx-underground 和 VirusTotal 都是以“约多少 TB / PB”来描述自身数据量,记者也沿用了这一“约算”的口径。
为了便于读者形成直观概念,记者假定使用的是标准的 1 TB 3.5 英寸桌面机械硬盘——这类硬盘为了适配通用机箱,物理尺寸基本统一,高度约为 1 英寸(约 2.54 厘米)。在这一前提下,只需要关注“高度”这一维度,就可以模拟“把硬盘一块块往上垒”的效果。文章同时也忽略了硬盘在实际使用中标称容量与可用容量之间的差异,直接按照标称 1 TB 计算,以简化推演。
根据在线存储单位换算工具的结果,vx-underground 所称约 30 TB 的恶意软件数据,大致相当于 30 块 1 TB 硬盘的容量。如果把这 30 块硬盘自下而上叠放,其高度约为 30 英寸,即约 2.5 英尺(不足 1 米)。文章作者以自身身高作对照称,相比自己 6 英尺(约 1.83 米)的身高,这样一摞硬盘更像是堆在脚边的小箱子。
而当视角转向 VirusTotal 时,这种对比立刻发生了“量级跃迁”。以 31 PB 总量换算,约需 31,744 块 1 TB 硬盘才能完全容纳。如果同样采用“竖着往上堆”的方式,这根由硬盘构成的“数据塔”理论高度将达到约 2,645 英尺(约合 806 米)。在世界超高层建筑排行榜上,这个高度已经逼近位于迪拜的全球第一高楼哈利法塔(Burj Khalifa),后者约为 2,722 英尺(约 829 米)。
换言之,如果把 VirusTotal 的恶意软件样本视作一个纯由硬盘构成的立柱,其高度仅比哈利法塔矮出不足 80 英尺,已经足以与这座“垂直城市”的天际线相提并论。记者还选取了另一个标志性参照物——巴黎埃菲尔铁塔,其高度约 1,083 英尺(约 330 米)。按文中粗略估算,VirusTotal 当前所积累的恶意软件样本量,大致相当于“两座半埃菲尔铁塔”那样高的硬盘堆叠。
报道中配发了一张信息可视化示意图,将多个参照对象按高度从高到低横向排开。从左至右依次是:约 2722 英尺高的哈利法塔;约 2645 英尺高、由硬盘堆成的 VirusTotal “数据塔”;约 1792 英尺高的一号世界贸易中心大楼;约 1,083 英尺高的埃菲尔铁塔;身高 6 英尺的记者本人;以及高度仅约 2.5 英尺、代表 vx-underground 30 TB 数据的一小摞硬盘。通过这一排列,读者可以一目了然地感受到不同“恶意软件银行”在数据规模上的巨大差距。
报道最后指出,这些体量惊人的恶意软件样本库不仅是安全研究的“必需品”,同时也在无形中刻画出了当今网络威胁态势的庞大阴影。当安全企业和研究人员在这些数据堆里检索、标注、建模时,他们实际上是在与一座座“看不见的高塔”赛跑,以尽可能提前发现下一波攻击浪潮的蛛丝马迹。

