在人工智能浪潮推高数据中心用电需求的背景下,美国伊利诺伊大学厄巴纳-香槟分校的研究团队开发出一种全新的三维打印纯铜冷却板技术,有望将数据中心用于冷却的电力消耗从目前约占总耗电量的三成,大幅降至约1.1%。研究人员估算,如果这一技术在超大规模数据中心得到全面应用,整体制冷相关能耗有望削减超过90%,接近目前热工程所能实现的效率极限。

根据国际能源署数据,2025年全球数据中心用电量达到485太瓦时,其中约30%—这一数值已经超过瑞典一国全年的电力消费—被用于冷却设施本身。与此同时,生成式人工智能的快速发展,使得行业一度甚至开始考虑将数据中心建到太空,以获取更直接的太阳能供给。更具讽刺意味的是,在这些庞大的电力开支中,约有三分之一与计算本身无关,只是用来把被芯片转化为热量的电能再“搬走”。
以英伟达的GB200芯片为例,单颗芯片功耗就达到1200瓦,每天电力消耗约28.8千瓦时,接近美国一个普通家庭的平均日用电量。由于不可避免的焦耳热效应,这1200瓦几乎等量转化为热功率,理论上仅一小时就足以加热超过50杯水。假如把成千上万,甚至数十万这样的芯片像现在这样密集堆叠在机架中,不进行任何冷却干预,仅xAI的Colossus 1数据中心220,000块GPU、300兆瓦的功率,就足以在一小时内把大约78.5万平方英尺的空间加热到约1200摄氏度,比岩浆还要炽热。由此可见,冷却已经成为数据中心运行中不容回避、甚至是生死攸关的环节。
论文第一作者、机械工程师Behnood Bazmi指出,“冷却是当前芯片设计的瓶颈。通过弥合计算设计与制造能力之间的鸿沟,我们的方案为更高能效的芯片及各类电子设备液冷提供了一条新路径。”长期以来,数据中心主要依赖风冷:在CPU、GPU上安装金属散热片,通过薄鳍片扩展热交换面积,再辅以大功率风机强制对流。为了驱动庞大的空气处理系统,这一方式本身就消耗大量电力,而且面对新一代AI加速芯片剧烈攀升的热流密度,传统风冷正愈发显得力不从心。
因此,行业正在加速转向直接贴片液冷方案,即在处理器上方安装金属“冷板”,通过其内部微小通道引导冷却液流动,将芯片热量快速导出。市面上的常规冷板早已投入使用,但其内部鳍片与流道设计普遍以加工简便为优先,几何形状多为矩形或圆柱形,材料则多采用铝合金或不锈钢等,难以兼顾极致的换热性能与流动阻力控制。
伊利诺伊大学团队的创新,集中体现在材料与鳍片结构这两个关键环节。研究人员采用拓扑优化方法,引入数学优化算法,对冷板内部微结构重新设计,从传统的方柱、圆柱形几何,演化到更加复杂、锯齿状、尖锐的三维形态,在兼顾流道阻力的前提下最大化换热面积和热性能。由于这些高度复杂的结构几乎无法通过传统工艺经济地加工,团队转而采用先进的电化学增材制造技术(ECAM),以逐层堆积的方式直接生成所需形状。在材料选择上,他们大胆使用导热性能极佳、但在常规3D打印中极难精细成形的纯铜。
论文通讯作者、机械工程师Nenad Miljkovic介绍,ECAM技术可以将纯铜加工出细至30至50微米的精细特征,这一尺度甚至小于一根人类头发的直径。实验结果显示,与商用常规冷板相比,这种经拓扑优化设计、由纯铜制成的冷板在液冷工况下最高可提升约32%的冷却性能,同时将系统的压降降低最大达68%。压降的下降意味着单位时间内推动冷却液循环所需的泵功率大幅减少,两者叠加带来显著的整体能耗节约。
研究团队进一步从数据中心整体层面进行了建模分析。在目前风冷仍占主导的场景下,一座装机容量为1吉瓦的数据中心,仅冷却基础设施就可能需要约550兆瓦的额外功率。而在采用他们提出的优化液冷方案后,相同规模设施的冷却用电有望降至约11兆瓦。换言之,在维持对大规模AI硬件产生的极端热量进行有效散热的同时,冷却的能耗占比有望从当前约30%至35%压缩到约1.1%,整体降幅超过95%。
如果这些模型预测能够在真实的超大规模部署中重现,其对数据中心能效的影响将是革命性的。按研究团队的估算,这一体系可助力数据中心实现约1.011的电源使用效率(PUE),意味着从电网输入的每一瓦功率几乎都直接用于计算,而不是被消耗在冷却、输配电损耗或照明等辅助手段上。作为对比,目前全球最先进的一批超大规模数据中心PUE大多在1.1至1.3之间,而理论上“完美”的数据中心PUE为1.0,即没有任何能量浪费在冷却和支撑基础设施上。
当然,研究团队也坦言,目前关于整座数据中心能耗的数字仍然停留在模型推演阶段,而非基于真实吉瓦级数据中心的现场实测结果。即便如此,如果该技术能够如预期那样在规模化部署中保持性能,其仍有望大幅降低当前AI热潮背后被忽视的最大隐性能耗之一——数据中心冷却。研究人员认为,这一将设计优化与先进制造工艺相结合的思路,并不仅限于数据中心,还可拓展用于更广泛的电子设备甚至其他需要高效热管理的工程领域。

