NVIDIA®Quadro®GV100正在革新工作站,以满足经过AI强化的设计和可视化工作流程的需求。 此产品采用NVDIA Volta架构,能提供设计师,建筑师和科学家需要的卓越显存容量、可扩展性及性能,帮助他们打造和设计超乎常规的作品,以及解决棘手的难题。
利用 AI 增强渲染
- 使用完全保真的大规模数据集
- 通过经过 AI 加速的去噪享受流畅的视觉互动
- 使用保真度更高的 CAE 模拟模型
- 利用更快的求解器性能探索更多设计选择
- 在 VR 中使用复杂的照片级真实感数据集
- 享受最佳的NVIDIA Holodeck体验
- 通过NVIDIA NGC存取用于人工智能开发的深度学习框架
- 使用Tensor核心和NVLink技术加速AI训练/推理能力
Quadro GV100 GPU 基于专为 NVIDIA 打造的先进 12nm FFN (FinFET NVIDIA) 高性能制造流程而设计,包含 5120 个 CUDA 核心,是适合专业桌面 HPC、人工智能 (AI)、虚拟现实 (VR) 和图形工作负载的强大计算平台。
Tensor 核心Quadro GV100 拥有 640 个Tensor 核心,新增专为深度学习矩阵算法构建的混合精度核心,与前一代产品相比,训练可提升 8 倍 TFLOPS。
高速 HBM2 內存Quadro GV100 以 Volta 经过极大优化的 32GB HBM2 显存子系统打造而成,拥有业界超快显存(870 GB/s 最高带宽),是易受延迟影响的应用程序处理大型数据集的理想平台。与前一代产品相比,Quadro GV100 可提供两倍的显存容量和超过 20% 的显存带宽。
混合精准度计算此产品通过 16 位浮点精度计算将吞吐量提升两倍,并可减少所需要的存储空间,有助训练和部署更大的神经网络。此外,通过使用单独的并行整数和浮点数据路径,Volta SM 在处理包含计算和寻址计算的混合工作负载时也更为高效。
H.264 与 HEVC 编译码引擎两个专用的 H.264 和 HEVC 编码引擎以及一个专用的解码引擎均独立于 3D/计算管道,可为转码、视频编辑和其他编码应用程序提供高于实时的性能。
通过 NVLink 连接一对 Quadro GV100 显卡,即可以高达 100 GB/s 的速度在 GPU 之间传输数据(双向总带宽为 200 GB/s),如此便可增加有效显存占用和扩展应用程序性能。
NVIDIA® SLI® 技术利用多个 GPU 动态扩展图形性能、提高画质、增加屏幕有效使用区域,以及组装完全虚拟化的系统。
NVIDIA的NVLink技术提供两块GV100卡之间的高速连接与结合成一个HBM2 64GB内存。
这使得两个GPU都能够处理最大的计算工作量,为单一个工作站提供最佳的视觉处理计算解决方案。
采用高达 64 倍的 FSAA 技术(使用 SLI 则为 128 倍),显著减少视觉叠影或“锯齿”,呈现无与伦比的画质和逼真的场景。
32K材质和渲染处理可处理 32K x 32K 表面的纹理与渲染,支持需要极高分辨率和高质量图像处理的应用程序。
内存压缩采用第四代无损增量压缩技术,减少从每帧显存提取的数据量,进而将带宽提高 20%。
每块显卡支持多达四台 60Hz 刷新率的 5K 显示器或两台 8K 显示器。Quadro GV100 支持 60Hz 刷新率 4K 显示器的 HDR 色彩 10/12b HEVC 解码,以及 60Hz 刷新率 4K 显示器的 10b HEVC 编码。每个 DisplayPort 接口均可提供 4096x2160 @ 120 Hz 的超高分辨率和 30 位色彩。
NVIDIA® nView® 高级桌面管理软件可为终端用户提供前所未有的桌面控制体验,提高单台大型显示器或多显示器环境的生产力。
NVIDIA® Quadro® Mosaic 技术最多可在一个工作站的 4 个 GPU 和 16 个显示器之间以透明方式扩展桌面和应用程序,同时提供卓越的性能和画质。
NVIDIA® Quadro Sync II通过单个系统中 8 个 GPU(通过两块 Sync II 主板连接)同步多达 32 台显示器的显示和图像输出,可减少打造先进视频可视化环境所需的设备数量。
OpenGL四路缓冲立体支持可为专业应用程序提供顺畅的沉浸式 3D 立体声体验。
支持超高分辨率桌面通过拥有 32K 最大桌面尺寸的高分辨率显示设备获得更多 Mosaic 拓扑选择。
专业3D立体同步通过专门的连线直接将 3D 立体声硬件同步至 Quadro 显卡,以有效控制立体声音效。
Caffe2、MXNet、CNTK、TensorFlow 等深度学习框架及其他框架皆可缩短训练时间,并提供更高的多节点训练性能。GPU 加速库(如 cuDNN、cuBLAS 和 TensorRT)能够为深度学习推理和高性能计算 (HPC) 应用程序提供更高性能。
NVIDIA® CUDA® 并行计算平台可在本地执行 C/C++ 和 Fortran 等标准编程语言以及 OpenCL、OpenACC 和 Direct Compute 等 API,以加速处理光线跟踪、视频和图像处理及计算流体动力学等技术。
统一显存寻址无缝的单个 49 位虚拟地址空间可在 CPU 和 GPU 显存的整个分配之间实现透明的数据转移。
NVIDIA® GPUDirect 视频技术GPUDirect 视频技术可避免不必要的系统显存复制和 CPU 占用,以加快 GPU 和视频输入/输出 (I/O) 设备之间的通讯。
NVIDIA Enterprise-Management Tools/企业管理工具极大限度地延长系统正常运行时间、无缝管理大规模的部署及远程控制图形与显示设置,以实现高效运算。
为工作流程选择正确的GPU
深入了解专业应用软件推荐的绘图卡.下载PDF
- 制造业和建筑业在检视设计的过程中,以VR内容让设计人员、工程师或客户见到栩栩如生的作品,让他们能在获得充份信息的情况下
做出决定,避免在动工后又大费周章来修改设计
- 医疗手术逼真演练
- 复杂系统的人为反应模拟
GPU 架构 | Volta |
CUDA 并行处理核心数 | 5120 |
显存 | 32 GB HBM2 |
显存位宽 | 4096-bit |
显存带宽 | 最高至 870 GB/s |
图形总线 | PCI Express 3.0 x16 |
FP64双精度浮点运算性能 (峰值) | 7.4 TFLOPs |
FP32单精度浮点运算性能 (峰值) | 14.8 TFLOPs |
FP16半精度浮点运算性能 (峰值) | 29.6 TFLOPs |
INT8整数运算性能 (峰值) | 59.3 TFLOPs |
深度学习运算性能 | 118.5 TOPs |
最大功耗 | 250 W |
显示接口 | 4x DP 1.4 |
显示分辨率 | 4x 4096x2160 @ 120Hz 4x 5120x2880 @ 60Hz 2x 7680x4320 @ 60Hz 1x 7680x4320 @ 120Hz |
散热 | 主动式 |
外观尺寸 | 4.4” 高 x 10.5” 长, 全高双插槽 |
图形APIs | Shader Model 5.1, OpenGL 4.51, DirectX 12.02, Vulkan 1.01 |
计算APIs | CUDA, DirectCompute, OpenCL™ |
支持Quadro GV100 NVLink互联 (选配) | 可接两片 |
支持Quadro Sync II (选配) | 是 |