NVIDIA除了有最强的AI硬件,同时也积极参与开源大模型,去年底推出了Nemotron 3系列,今天又发布了新一代的Nemotron 3 Super。Nemotron 3 Super号称是专为AI智能体打造,规模不算大,1200亿参数量,激活120亿,号称推理速度提升3倍,吞吐量暴涨5倍。
该模型支持1M上下文,解决多智能体上下文爆炸、目标跑偏问题。
创新的Mamba-MoE混合架构,解决了多Agent协同中的性能瓶颈。
值得一提的是,Nemotron 3 Super除了支持BF16、FP8之外,还可以在自家的Blackwell及之后的平台上支持NVFP4训练。
至于模型的表现,自然也要刷榜一波,NVIDIA表示Nemotron 3 Super在效率与开放性方面已登顶Artificial Analysis榜首,同等规模模型中准确率领先,并驱动NVIDIA AI-Q研究智能体在DeepResearch Bench及DeepResearch Bench II两大排行榜中位列第一。
生态方面,它已经被 Perplexity、Palantir、西门子、戴尔、HPE 等企业集成,可在 AWS、Azure、Google Cloud等平台使用。
对普通人来说,Nemotron 3 Super还有个特别的意义,那就是绝配当前大热的小龙虾OepnClaw,其在OpenClaw任务成功率上获得了85.6%的高分,表现逼近Claude Opus 4.6、GPT-5.4,但它可是开源免费的,成本要低太多了。
开源地址:https://huggingface.co/collections/nvidia/nvidia-nemotron-v3



