随着光追技术加持的新游戏越来越多,主流 PC 玩家群体所追求的 4K 游戏体验对显卡的压力也越来越高,在 RTX 40 系显卡时代,60 和 70 后缀的显卡想要征服 4K + 最高画质下的 3A 大作多少还是有些困难的。好在新一代 RTX 5070 显卡拥有全新 Blackwell 架构和第五代 Tensor 核心,还有 DLSS 4 技术加持,玩家们总算看到了一丝希望。
本次我们评测的这款影驰 GEFORCE RTX 5070 FIRE 显卡主打轻薄设计和高性价比,那么它的性能能够征服 4K 游戏呢?咱们今天就来揭晓答案。
为了发挥显卡的全部性能,本次我们搭建了如上图所示的硬件测试平台。
影驰 GEFORCE RTX 5070 FIRE 显卡的造型非常硬朗,显卡装甲边缘只做了小弧度的倒角处理,视觉上看起来四四方方。纯黑配色搭配部分类凯芙拉纹理装饰和凹槽纹路都让它充满了暗黑机械风的味道。
其实这个外观在之前的影驰 RTX 5090 D 大将上就见过,只是风扇由黑透改为了黑色,风扇上的 Logo 也不一样,但中间风扇周围的一圈“尖刺”设计仍旧得以保留,“旭日黑铠”直接传承了过来。
新一代的霜环风扇包含 3 个 90mm 直径风扇;扇叶数量调整到 7 叶,风压提升约 15%,同转速下噪音降低 5%,整体使用体验更好。
显卡背板的设计也和影驰 RTX 5090 D 大将基本保持一致,只是左侧的字母印花范围更大,右侧还是以圆角矩形开口为基础,内部做了四个梯形斜对称的个性镂空装饰。
尺寸方面,影驰 GEFORCE RTX 5070 FIRE 显卡的三围分别是 300*120*40mm(含挡片),净重约 829g,符合 SFF-Ready 显卡设计规范,旨在通过小尺寸规格简化小机箱和配件的选择。
显卡正面装甲也对侧面形成了全包裹支持,有效提升保护性的同时,也让一体性变得更强。
金手指区域改成了新版 PCIe5.0*16 规格设计。
显卡供电接口依旧为 12V-2*6 设计,而且保持了反扣式朝向和独立背板开槽,这点好评。
接口挡板区域,影驰还设计了如动物鳞片般的不规则开孔组,接口包含 3 个 DP2.1b 和 1 个 HDMI2.1b,支持最高 8K / 165Hz 输出。
配件给到了 1 根黑色编织材质的 16pin 转 2*8pin 电源转接线和 1 本快速安装指南。
Blackwell 架构
RTX 50 系列显卡这次采用的 Blackwell 加入了神经网络渲染的特性,其多单元流处理器 (SM) 具有更高的处理吞吐量,并且支持了 Flip Metering 来代替 CPU Pacing,让 GPU 更精准管理显示时间,尽可能达到每帧的画面生成时间保持一致,从而满足 DLSS 多帧生成的稳定性需求。
第五代 Tensor 核心
第五代 Tensor 核心能够加速重新排序,并新增了对 FP4 精度模型的支持,相较于第四代 Tensor 核心上所支持的 FP8 精度模型,吞吐量提升 2 倍;相比 FP16 精度模型,FP4 的显存使用不到一半,GPU 性能的提升却高达 2 倍。正是由于第五代 Tensor 核心的加入,才让 DLSS 4 技术能够顺利支持多帧生成功能。
第四代 RT 核心
在 RT Core 方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,初代使用 RT Core 的 Turing 架构的 8 倍,并增强了压缩以减少内存占用,相比上代的显存占用减少 25%,光线追踪效果也得到了前所未有的细节提升。
配备 GDDR7 显存
除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存。GDDR7 采用的是 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30 Gbps。
RTX 5070 规格
具体到产品规格上,影驰 GEFORCE RTX 5070 FIRE 显卡基于最新一代 GB205-300 核心和 TSMC 4N 架构制程工艺打造,包含 6144 个 CUDA 核心、988 个 Tensor 核心、 94 个光追核心。
影驰 GEFORCE RTX 5070 FIRE 显卡的核心频率工作范围是 2325MHz-2512MHz,显存方面升级为 192-bit 显存位宽的 12GB GDDR7 规格,总带宽来到了 672GB/s。TDP 功耗为 250W,相比上代 RTX 4070 增加了 50W。
烤机环节,影驰 GEFORCE RTX 5070 FIRE 显卡在甜甜圈单烤 20 分钟后,GPU 功耗稳定在了 250W,GPU 主频为 2415MHz,而 GPU 温度 71.5℃。其中 GPU 主频给的稍微有点保守,并没有上到 2500MHz,但也在标称的主频区间内。
在 3DMark Time Spy DX12 测试中,影驰 GEFORCE RTX 5070 FIRE 显卡得分达到了 22187 分,对比 RTX 4070 的 17392 分,提升幅度约 27.5%。
在 3D Mark Time Spy Extreme DX12 测试中,影驰 GEFORCE RTX 5070 FIRE 显卡得分达到了 10656 分,对比 RTX 4070 的 8261 分,提升幅度约 28.9%。
在 3DMark Portal Royal 实时光追测试中,影驰 GEFORCE RTX 5070 FIRE 显卡的综合分为 14031 分,对比 RTX 4070 的 11006 分,提升幅度达到了 27.5%。
理论测试环节,影驰 GEFORCE RTX 5070 FIRE 显卡的成绩相比 GeForce RTX 4070 显卡均高出 25% 以上,简单粗暴的性能提升让驾驭 4K 游戏不再只是想象,那接下来就用游戏实测来验证一下吧。
GeForce RTX 5070 显卡在 4K 游戏的表现上,应该是玩家朋友们最关心的,所以游戏测试环节依旧会以 4K 分辨率为主。
1、《CS2》
在竞技游戏《CS2》中:
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 32.7%,1% Low 帧提升 9.4%,平均延迟降低 25%。
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 37.7%,1% Low 帧提升 8.8%,平均延迟降低 28%。
2、《无限暖暖》
《无限暖暖》作为一款上市不到半年的端游,也支持了光线追踪和 DLSS,经过实测:
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 25.7%,1% Low 帧提升 8.7%。
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 20.5%,1% Low 帧提升 35.8%。
3、《古墓丽影:暗影》
《古墓丽影:暗影》只支持初版 DLSS,可以看作是传统光栅游戏的代表,经过实测:
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 21.7%,1% Low 帧提升 25.7%。
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 27%,1% Low 帧提升 18.4%。
4、《极限竞速:地平线 5》
《极限竞速:地平线 5》游戏优化出色,但对显存的要求并不低,经过实测:
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 29.6%,1% Low 帧提升 31.1%。
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 30.7%,1% Low 帧提升 66.2%。
5、《荒野大镖客:救赎 2》
《荒野大镖客:救赎 2》在传统光栅游戏中,也是很吃性能的,经过实测:
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 28.3%,1% Low 帧提升 9.0%。
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 25.5%,1% Low 帧提升 9.5%。
6、《黑神话:悟空》
在“众生平等”代表之作《黑神话:悟空》中,开启全景光追后的显卡压力非常大。经过实测:
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 23%,1% Low 帧提升 17.7%。
影驰 GEFORCE RTX 5070 FIRE 显卡相比 RTX 4070 显卡的平均帧数提升约 24%,1% Low 帧提升 15.3%。
RTX 50 系显卡新增的 DLSS 4 技术在 DLSS 3 的技术上,新增了全新的多帧生成技术,结合第五代 Tensor 核心的强大性能,利用 AI 为每个渲染帧生成至多 3 个额外帧,从而大幅提升游戏的 FPS 水平。
DLSS 4 配合全套 DLSS 技术,包括光线重建、超分辨率以及 DLAA 等功能,最多可实现传统图像渲染的 8 倍帧率。
多帧生成技术还可配合 NVIDIA Reflex 低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小。Blackwell 显示引擎也在 DLSS 4 技术发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足 DLSS 4 技术的要求,最高可提升 1 倍的像素处理能力。
DLSS 4 技术还带来了模型架构的重大升级,DLSS 光线重建、DLSS 超分辨率和 DLAA 特性均由首个实时 Transformer 模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧及多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。
官方表示,目前已有超过 75 款支持 DLSS 帧生成技术的游戏和应用可在 GeForce RTX 50 系列 GPU 上升级至 DLSS 多帧生成技术,不少主流 3A 大作也已于 50 系显卡正式发售后更新了 DLSS 4 多帧生成功能的支持,包括《心灵杀手 2》、《夺宝奇兵:古老之圈》、《黑神话:悟空》、《星球大战:亡命之徒》《寂静岭 2:重制版》等热门作品。
《赛博朋克:2077》作为首批支持 DLSS 4 技术最完善的游戏之一,如果在 4K 分辨率下开启光追,但不开启 DLSS 和帧生成选项,那么:
即使不开启光追,4K 分辨率下游戏平均帧数也只有 48 帧,在没有 DLSS 和帧生成技术的加持下,基本告别 4K 体验了。
幸好显卡支持 DLSS 4 技术,在游戏中开启 DLSS Multi frame Generation(DLSS 多帧生成)选项后,游戏帧数的表现瞬间就不一样了。我们依次在 4K 分辨率 + 超级光追画质 + DLSS 质量档设置下,选择 2x、3x 和 4x 多帧生成,运行游戏基准测试,分别得到了 67 帧、94 帧和 119 帧的游戏平均帧数,相比不开 DLSS 时的 21 帧,提升幅度分别达到了 3.19 倍,4.47 倍和 5.66 倍,原本完全无法在 4K 分辨率下畅玩,现在直接可以跑到 4K / 120Hz 了,不得不说 DLSS 4 给了 RTX 5070 这张显卡在光追游戏上脱胎换骨的体验。
在我们测试 RTX 5070 的这几天,《永劫无间》游戏推送了一次更新,支持了 DLSS 4 多帧生成功能,恰好可以作为一个典型竞技游戏,来测试下 DLSS 4 的性能提升和延迟表现如何。
首先,RTX 5070 在 4K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 105 帧,1% Low 帧 77 帧,平均延迟 41ms;
随后,当我们在设置菜单中开启 2x、3x 和 4x 多帧生成选项后,RTX 5070 的游戏平均帧数分别提升到 136 帧、170 帧、199 帧;而游戏平均延迟方面分别为 31ms、36ms 和 41ms。大家不难发现,开启多帧生成后游戏的平均延迟竟然还降低了,只有 4x 多帧生成下,平均延迟才回升到不开多帧生成时的 41ms,毫无疑问 DLSS 4 技术配合 Reflex 低延迟技术,在竞技游戏中的延迟表现完全可以接受。
那么多帧生成会影响画质吗?通俗点说就是会不会令画面变得更糊?为此我们也在《心灵杀手 2》中同一个场景截取了 3 种不同画质设置的游戏画面,分别是:
然后通过 NVIDIA ICAT 工具进行比较,在不放大的情况下 3 者根本看不出区别,所以我们挑选了 3 处细节进行放大对比。
首先是警员手臂衣服上的 FBI 标志,左侧和右侧分别是 DLAA(4K 渲染)和原生 4K 画质,中间是 DLSS 性能(1080P 渲染),经过放大可以看到中间图片的 FB 文字更糊一点,但左右基本看不出清晰度上的区别。
同样在警员的波浪卷发以及身旁右侧的树叶上也能看出中间的画面更糊一点,左右两边的图片却难以发现差距。
也就是说对于物理渲染分辨率上的天然鸿沟,DLSS 技术肯定是无法完全弥补画质差距的,但只要保持和原生画质相同的分辨率(即开启 DLAA),画面清晰度和细节几乎没有区别,更别说我们这种“盯帧式”比较有点吹毛求疵,正常游戏无论是 DLSS 性能档(1080P 渲染)还是 DLAA(4K 渲染)都不会有糊成一片,锯齿满满这种明显问题,所以最主要的还是看游戏适配,在乎画质的小伙伴直接开启 DLAA 就好了。
生产力方面,IT之家实测了 UL Procyon 的图像视频剪辑、以及 AI 文本撰写等性能。
在 UL Procyon 的视频剪辑性能测试项目中,GPU 加速,得益于 Blackwell 架构升级的第九代 NVENC 编码器和 NVDEC 解码器,其在 H.264/ H.265 4:2:2 编码的 8 位和 10 位视频上有着非常大的优势,经过实测:
影驰 GEFORCE RTX 5070 FIRE 显卡的视频编辑性能相较于 RTX 4070 显卡提升约 16.5%。
在 UL Procyon AI 推理性能测试项目中的 Microsoft Windows ML 版本测试中:
影驰 GEFORCE RTX 5070 FIRE 显卡的 Microsoft Windows ML 版本 AI 推理性能提升相较于 RTX 4070 显卡提升了约 8.8%。
在侧重建模和渲染性能的 blender Benchmark 4.3.0 版本基准测试中:
在 Blender 基准测试的 3 场景渲染中,影驰 GEFORCE RTX 5070 FIRE 显卡的渲染性能相较于 RTX 4070 显卡提升分别约为 13.8%、30.1%、17.1%。
作为一款“标准版”RTX 5070 显卡,影驰 GEFORCE RTX 5070 FIRE 显卡没有惊艳的外观设计和华丽的 RGB 灯效,但性能表现和稳定性都较为出色,成功跃升 4K 全能游戏卡的行列,让消费者有了更加实惠的选择。