
安娜的档案称,此前该档案馆发现某种能够大规模抓取 Spotify 平台数据的方法,随后该档案馆意识到或许可以通过数据建立用于保存音乐的音乐档案馆,接下来就是抓取数据。
最终抓取的数据和概述如下:
Spotify 作为全球规模最大的流媒体音乐平台目前拥有 2.56 亿首歌曲,其中 99.9% 的歌曲已经被抓取;
安娜的档案成功存档 8600 万首音乐文件,约占总播放量的 99.6%,整体数据大小约为 300TB;
按照 Spotify 平台受欢迎程度来确定歌曲的优先级,用户可以查看排名前 10000 的歌曲榜单;
对于流行程度非零的歌曲几乎都已经抓取,75kbit/s 的 OGG Opus 格式;
添加元数据时没有对音频文件进行重新编码,但提供差异文件存档,包含原始哈希和元数据文件用于重建;
对于流行程度为零的歌曲大约抓取了 50%,音频被重新编码为 75kbit/s 的 OGG Opus 格式,这种音质较低但体积小;
数据截止至 2025 年 7 月,也就是在此之后上架的音乐或更新都不包含在下载数据内。
由于数据非常大安娜的档案将以 BT 种子形式发布数据,也就是说除非所有人都已经放弃这部分数据,否则数据将 BT 形式流传在整个互联网上,任何人想要将其彻底清除都几乎是不可能的事情。
不过需要说明的是目前数据还在构建并计划分阶段发布,暂时发布的数据只有歌曲的元数据,接下来音乐文件、附加文件元数据、专辑封面以及 zstdpatch 文件等都将分阶段发布,具体发布时间未知。

