产品新闻

发布日期 : 2020/05/19

丽台开箱评测 | Quadro RTX 8000

高端显卡的各项指标都很高，具备更多的 CUDA 核心，具备更大的显存空间，具备更高的显存带宽，使用的领域更广。下面我们对 Quadro RTX 8000 做一个整体的开箱评测。

开箱

整体外观

和其他 Quadro RTX 显卡包装一样，使用绿白灰搭配，正面的灰色格子采用渐变的颜色很有现代感和立体感，包装的正面和顶部、侧面都有显卡型号的标识。整体拿在手里分量感十足，包装的材质很结实。

RTX 几个字有金属反光效果，凸显了这代显卡最重要的功能之一——实时光线追踪。

拆开包装

显卡包装

内部包装也和丽台以往的包装不一样，外壳和防震泡沫是一体的，显卡安放其中。给人的感觉是坚固、牢靠。

显卡配件盒

显卡外面还有一层透明防静电袋，配线盒里面有用户手册、支持手册、8 pin 转双6 pin 电源线、DP 转 DVI 转接头、DP 转 HDMI 转接头等，这是众多使用 DVI 显示器或 HDMI 显示器的福音，再也不用另外单独购买转接头了。

显卡正面

显卡外观主要采用绿、反光银色和黑色搭配，与包装风格一致。面板反光应该是为了突出 RTX 这个主题了。在显卡正面和脊背上都能看到显卡型号的标识。
Quadro RTX 8000 是双插槽，1个涡轮风扇，显卡采用 8 pin 加 6 pin 的供电接口，对于最大功耗为 295W 的 RTX8000 来讲是足够用了。
显卡顶部总共有 3 个接口：NVLink、SYNC、Stereo。
NVLink 技术取代了 SLI 技术，可以配合 Quadro NVLink 2-Slot 或者 3-Slot 使用。NVLink 技术不但具备多卡同步输出的功能，在应用支持的情况下，还能实现显存叠加的功能，使两块卡叠加成一个更大的显存，那就有96GB 超大的显存可用。
SYNC 接口要配合 Quadro SYNC II 卡来使用，实现多卡的显示信号同步输出。多余大屏拼接的用户来讲可以延续之前的使用方法。
Stereo 接口要配合 3D 立体档板来输出 3D 立体信号的。
总线接口是 PCIE 3.0 接口，向下兼容 PCIE 2.0。目前市场上主板大都是使用这种接口的。

显卡显示接口

显示接口有了新的变化，不是 4xDP + 1xDVI 的配置，改成了4xDP + 1xVirtuallink的配置。

DP 接口都支持 DP 1.4 的协议，最高分辨率可以达到 7680x4320。而 Virtuallink接口则是下一代 VR 设备使用的标准接口，一个接口可完成供电、显示传输、控制信号多个功能。

显卡PCB板

性能测试

测试平台详细设置

测试显卡详细参数

测试软件

1. SPECviewperf 13

SPECviewperf 13 是基于专业应用上衡量图形性能被广泛应用的测试软件。该软件对基于 OpenGL 和 Direct X 的专业绘图软件进行基准评测，SPECviewperf 13带来了全新的 9 个专业图形测试场景，SPECviewperf 13 测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过 6,000 万个定点数据，能够充分反映出显卡的专业图形性能，此次测试我们使用软件默认配置进行评测。

从测试结果来看，RTX 8000看来Turing架构增加的不仅仅是光线追踪的效率和深度学习的效率。在专业应用的性能也非常不错。

2. SuperPosition Benchmark

这款软件更像是在一个复杂的游戏环境，在不同的光场效果中对显卡 DX 和OpenGL 渲染性能及稳定性的评测，这次评测使用的 4K 分辨率进行测试。

OpenGL 测试结果

DirectX 测试结果

3. vRay Benchmark

Chaos Group 的 VRay 在渲染领域早已被广大用户认可了，由于 GPU 渲染性能的提升，Chaos Group 在 VRay Next 上推出了 VRay GPU NEXT版本，支持调用Nvidia CUDA 核心进行渲染，随着技术的不断更新 GPU 渲染的质量上几乎和CPU 没有区别。GPU 算力强劲渲染时间成本会更低，并且支持多卡加速渲染，本次评估仅测试单卡的渲染性能。

测试截图

从测试结果看使用 RTX8000 只用了 44 秒，对于单卡的渲染速度来讲，已经是很快了。

4. CUDA-Z

就像我们熟知的 CPU-z 、GPU-z 一样，CUDA-z 是对 NVIDIA GPU 处理器的一些基本信息的采集， Geforce、Quadro、Tesla 卡都可以配合使用。

测试截图

CUDA 计算能力：

在 CUDA-z 的测试项目中，我们实际用到最多的是单精度浮点运算，如果有使用到双精度科学计算的，推荐使用 GV100 或者 GP100 双精计算能力高的 GPU。

RTX8000 单精计算的能力达到了 11.7T。这么强的单晶浮点数是 CPU 不能匹敌的，越来越多的应用把计算从 CPU 转向了 GPU，48GB 的大显存可以加载更多计算数据，在显存中进行交互，加快计算速度。

5. 3Dmark Port Royal

测试截图

测试结果

目前 NVIDIA 的 RTX 渲染的 Benchmark功能， 3Dmark 的 Port Royal 可以支持。测试场景里带了大量金属的材质，反射效果惊艳。RTX8000 渲染 FPS 达到了38 左右帧，还算流畅。目前游戏行业已经有 BF5 使用这种技术，相信未来在工业制造领域、影视后期领域也会被广泛的使用。

6. NVIDIA Tensorflow example

我们选择 NVIDIA Tensorflow 的一个示例来测试显卡的性能。在相同参数设置的情况下，哪块卡在一秒内训练的图片数越多，说明显卡在示例学习方面的性能越好

可以看到，RTX 8000 在满载额时候每秒处理的数量最多为 643 张。

Quadro RTX 高端卡都具有 Tensor Core，可以实现图像加 AI 的一些应用。例如在渲染的同时可以实现去 AI 噪点，或者其他 AI 推理的一些工作。

总结

具有 RTCores 支持 RTX 实时光线追踪渲染，能渲染出具有流光溢彩真实感的画面。渲染速度非常快，在诸多行业可视化的工业设计流程上会有很好的推动作用。
相较 RTX 6000，Quadro RTX 8000的显存达到了 48GB。大显存的意义在于能加载更大的 3D 场景而不至于显存溢出，导致渲染失败。有了 NVLink 的加持在很多应用上可以实现 96GB 的巨大显存。
具有 Tensor Cores，可以加速深度学习和 AI 推理。在人工智能大力发展的今天，有了 Tensor Cores 的加持，很多应用会变得如虎添翼。此时大显存又能显示出优势，能多的数据加载到显存里，能在很大程度上加快计算速度。减少数据 COPY 的时间。

虚拟桌面系统

TERA2321 DP+DVI Zero Client

较高安全性、易于管理维护的双显示终端机，适用VMware或Amazon WorkSpaces使用环境

TERA2220 PCoIP Host Card

为重度使用者从远程服务器、工作站或计算机传送高分辨率、双显示影像效能到终端设备

PCoIP 管理软件

让IT管理者能够轻鬆快速地从单一控制台管理众多PCoIP Zero Clients

RZ2215 Ultra- Thin Client

高安全性和小巧精实的设计，支援4K双屏幕显示与进阶功能扩充以符合各种需求

RZ2215 Ultra-Thin Client / Trusted Zero Client

高安全性和小巧精实的设计，支援零信任架构以及4K双屏幕显示与进阶功能扩充以符合各种需求

RDP Zero Client

专为任务工作者打造，使用起来快如闪电，却非常实惠、节能、不占空间

GeForce 游戏卡

WinFast RTX 3050 CLASSIC 8G

NVIDIA Ampere GPU/15520 MHz Base clock/1777 MHz Boost clock

WinFast RTX 2060 SUPER HURRICANE 8G Rev A

NVIDIA Turing GPU/1470 MHz Base clock/1695 MHz Boost clock

WinFast GTX 1650 ES OC

NVIDIA Turing GPU/1410 MHz Base clock/1590 MHz Boost clock

GTX 1050 Ti GFAM

NVIDIA GeForece GTX 1050 Ti

WinFast GT 710 2G EC版

Kepler GPU / Base clock 954MHz

NVIDIA 专业显卡

NVIDIA RTX 5880 Ada Generation

Ada Lovelace GPU / 14,080 CUDA Cores / 440 Tensor Cores / 110 RT Cores / 48GB DDR6 Memory with ECC

NVIDIA RTX 4000 Ada Generation

Ada Lovelace 架构 / 6144 CUDA 核心 / 192 Tensor 核心 / 48 RT 核心 / 20GB DDR6 显存

NVIDIA RTX 2000 Ada Generation

Ada Lovelace GPU / 2,816 CUDA 核心 / 88 Tensor 核心 / 22 RT 核心 / 16GB DDR6 显存

NVIDIA T400︱T400 4GB

Turing GPU/384 CUDA 核心/ 2GB/4GB DDR6 内存 /3x mDP

高性能运算 深度学习GPU

NVIDIA DGX 系统

NVIDIA IGX Orin Development Kit

为边缘人工智慧运算提供进阶功能的安全及保障

NVIDIA L40S

MLOps 解决方案

GPU资源分配与管理系统 (GDMS)

GPU AI 开发软件

Twinmotion

Reality Capture

WinFast 工作站和服务器

WinFast GS2040T

2U/6 GPU/2 CPU/16 DIMM slot

WinFast WS750

Mid-Tower/1 GPU/1 CPU/4 DIMM slot

边缘计算

边缘计算 - Jetson Orin

入门级边缘 AI 的新标准

边缘计算 - Jetson AGX Xavier

计算密度、能效和 AI 推理能力树立了新的标杆

边缘计算 - Jetson Xavier NX

功能强大的模组

边缘计算 - Jetson TX2

可为嵌入式 AI 计算设备提供出色的速度与能效

边缘计算 - Jetson Nano

将现代AI的力量带入数百万台设备

边缘计算 - 丽台自研

最适配 NVIDIA Jetson 的载板与整机组合

产品新闻

丽台开箱评测 | Quadro RTX 8000

开箱

拆开包装

性能测试

测试平台详细设置

测试显卡详细参数

测试软件

1. SPECviewperf 13

2. SuperPosition Benchmark

3. vRay Benchmark

4. CUDA-Z

CUDA 计算能力：

5. 3Dmark Port Royal

6. NVIDIA Tensorflow example

总结

高性能运算深度学习GPU