发布日期 : 2020/05/19

丽台开箱评测 | Quadro RTX 8000


高端显卡的各项指标都很高,具备更多的 CUDA 核心,具备更大的显存空间,具备更高的显存带宽,使用的领域更广。下面我们对 Quadro RTX 8000 做一个整体的开箱评测。

开箱

整体外观

和其他 Quadro RTX 显卡包装一样, 使用绿白灰搭配,正面的灰色格子采用渐变的颜色很有现代感和立体感,包装的正面和顶部、侧面都有显卡型号的标识。整体拿在手里分量感十足,包装的材质很结实。

RTX 几个字有金属反光效果,凸显了这代显卡最重要的功能之一——实时光线追踪。

拆开包装

显卡包装

内部包装也和丽台以往的包装不一样,外壳和防震泡沫是一体的,显卡安放其中。给人的感觉是坚固、牢靠。

显卡配件盒

显卡外面还有一层透明防静电袋,配线盒里面有用户手册、支持手册、8 pin 转双6 pin 电源线、DP 转 DVI 转接头、DP 转 HDMI 转接头等,这是众多使用 DVI 显示器或 HDMI 显示器的福音,再也不用另外单独购买转接头了。

显卡正面

  • 显卡外观主要采用绿 、反光银色和黑色搭配,与包装风格一致。面板反光应该是为了突出 RTX 这个主题了。在显卡正面和脊背上都能看到显卡型号的标识。
  • Quadro RTX 8000 是双插槽,1个涡轮风扇,显卡采用 8 pin 加 6 pin 的供电接口,对于最大功耗为 295W 的 RTX8000 来讲是足够用了。
  • 显卡顶部总共有 3 个接口:NVLink、SYNC、Stereo。
  • NVLink 技术取代了 SLI 技术,可以配合 Quadro NVLink 2-Slot 或者 3-Slot 使用。NVLink 技术不但具备多卡同步输出的功能,在应用支持的情况下,还能实现显存叠加的功能,使两块卡叠加成一个更大的显存,那就有96GB 超大的显存可用。
  • SYNC 接口要配合 Quadro SYNC II 卡来使用,实现多卡的显示信号同步输出。多余大屏拼接的用户来讲可以延续之前的使用方法。
  • Stereo 接口要配合 3D 立体档板来输出 3D 立体信号的。
  • 总线接口是 PCIE 3.0 接口,向下兼容 PCIE 2.0。目前市场上主板大都是使用这种接口的。

显卡显示接口

显示接口有了新的变化,不是 4xDP + 1xDVI 的配置,改成了4xDP + 1xVirtuallink的配置。

DP 接口都支持 DP 1.4 的协议,最高分辨率可以达到 7680x4320。而 Virtuallink接口则是下一代 VR 设备使用的标准接口,一个接口可完成供电、显示传输、控制信号多个功能。

显卡PCB板

性能测试

测试平台详细设置

测试显卡详细参数

测试软件

1. SPECviewperf 13

SPECviewperf 13 是基于专业应用上衡量图形性能被广泛应用的测试软件。该软件对基于 OpenGL 和 Direct X 的专业绘图软件进行基准评测,SPECviewperf 13带来了全新的 9 个专业图形测试场景,SPECviewperf 13 测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过 6,000 万个定点数据,能够充分反映出显卡的专业图形性能,此次测试我们使用软件默认配置进行评测。

从测试结果来看,RTX 8000看来Turing架构增加的不仅仅是光线追踪的效率和深度学习的效率。在专业应用的性能也非常不错。

2. SuperPosition Benchmark

这款软件更像是在一个复杂的游戏环境,在不同的光场效果中对显卡 DX 和OpenGL 渲染性能及稳定性的评测,这次评测使用的 4K 分辨率进行测试。

OpenGL 测试结果

DirectX 测试结果

3. vRay Benchmark

Chaos Group 的 VRay 在渲染领域早已被广大用户认可了, 由于 GPU 渲染性能的提升,Chaos Group 在 VRay Next 上推出了 VRay GPU NEXT版本,支持调用Nvidia CUDA 核心进行渲染,随着技术的不断更新 GPU 渲染的质量上几乎和CPU 没有区别。GPU 算力强劲渲染时间成本会更低,并且支持多卡加速渲染,本次评估仅测试单卡的渲染性能。

测试截图

从测试结果看使用 RTX8000 只用了 44 秒,对于单卡的渲染速度来讲,已经是很快了。

4. CUDA-Z

就像我们熟知的 CPU-z 、GPU-z 一样,CUDA-z 是对 NVIDIA GPU 处理器的一些基本信息的采集, Geforce、Quadro、Tesla 卡都可以配合使用。

测试截图

CUDA 计算能力:

在 CUDA-z 的测试项目中,我们实际用到最多的是单精度浮点运算,如果有使用到双精度科学计算的,推荐使用 GV100 或者 GP100 双精计算能力高的 GPU。

RTX8000 单精计算的能力达到了 11.7T。这么强的单晶浮点数是 CPU 不能匹敌的,越来越多的应用把计算从 CPU 转向了 GPU,48GB 的大显存可以加载更多计算数据,在显存中进行交互,加快计算速度。

5. 3Dmark Port Royal

测试截图

测试结果

目前 NVIDIA 的 RTX 渲染的 Benchmark功能, 3Dmark 的 Port Royal 可以支持。测试场景里带了大量金属的材质,反射效果惊艳。RTX8000 渲染 FPS 达到了38 左右帧,还算流畅。目前游戏行业已经有 BF5 使用这种技术,相信未来在工业制造领域、影视后期领域也会被广泛的使用。

6. NVIDIA Tensorflow example

我们选择 NVIDIA Tensorflow 的一个示例来测试显卡的性能。在相同参数设置的情况下,哪块卡在一秒内训练的图片数越多,说明显卡在示例学习方面的性能越好

可以看到,RTX 8000 在满载额时候每秒处理的数量最多为 643 张。

Quadro RTX 高端卡都具有 Tensor Core,可以实现图像加 AI 的一些应用。例如在渲染的同时可以实现去 AI 噪点,或者其他 AI 推理的一些工作。

总结

  • 具有 RTCores 支持 RTX 实时光线追踪渲染,能渲染出具有流光溢彩真实感的画面。渲染速度非常快,在诸多行业可视化的工业设计流程上会有很好的推动作用。
  • 相较 RTX 6000,Quadro RTX 8000的显存达到了 48GB。大显存的意义在于能加载更大的 3D 场景而不至于显存溢出,导致渲染失败。有了 NVLink 的加持在很多应用上可以实现 96GB 的巨大显存。
  • 具有 Tensor Cores,可以加速深度学习和 AI 推理。在人工智能大力发展的今天,有了 Tensor Cores 的加持,很多应用会变得如虎添翼。此时大显存又能显示出优势,能多的数据加载到显存里,能在很大程度上加快计算速度。减少数据 COPY 的时间。