NVIDIA® Quadro RTX™ 8000 使用 NVIDIA Turing™ 架构及 NVIDIA RTX™ 平台,为专业工作流程带来计算机绘图领域十余年来最重大的进步。设计师和艺术家现在可以利用硬件加速光线追踪,深度学习,和高级着色的强大功能,大幅提高生产力,并以前所未有的速度创作出色的内容。
Quadro RTX 8000具有72个用于即时光线追踪的RT核心和用于AI增强工作流程的576个Tensor核心,可实现超过130 TFLOPS的深度学习效能。 Quadro RTX 8000采用48 GB GDDR6内存,可通过 NVIDIA NVLink 技术扩展至96 GB,可适用于大容量内存需求的高负载工作,例如创造最复杂的模型,建构大量架构数据集,可视化大量数据科学工作负载,使用实时8K电影内容,加快高分辨率之最终渲染速度。 VirtualLink® 提供与下一代高分辨率VR 头戴式显示器的连接,使您可以在最引人注目的虚拟环境中查看您的工作。
用高速互连方式连接两个 GPU,将内存容量扩展到 96 GB,并以 100 GB/s 的数据传输率提供更高效能。
配备业界率先采用的 48 GB 超高速 GDDR6 内存,可储存复杂的设计,庞大的建筑数据集,8K 电影内容等。
NVIDIA Turing 配备用于光线追踪的全新 RT 核心,用于人工智能的 576 个Tensor核心,以及用于平行运算的 4608 个 CUDA 核心,是世界上最先进的绘图处理器。
业界首创的 VirtualLink 用来简化现有及下一代的高分辨率 VR 头戴式显示器的连接。
用 NVLink 连接两张 Quadro RTX 8000 将有效可用内存加倍,并可利用高达 100GB/s (双向总带宽) 的 GPU 对 GPU 数据传输率将应用程序效能扩张。
利用多个 GPU 动态扩展绘图效能,加强影像质量,扩大显示空间,并组装一套完全虚拟化的系统。
使用高达 64X FSAA (SLI 模式下 128倍) 大幅降低视觉混迭伪像或「锯齿」以获得优秀的影像质量和极为逼真的场景。
材质来自并成像到 32K x 32K 表面以支持需要最高分辨率和质量的图像处理应用程序。
在单一系统的 8 个 GPU 中同步最多 32 个显示器的显示和画面输出 (透过两张 Sync II 适配卡连接),减少建立高阶影像可视化环境所需的机器数量。
深度学习框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快训练时间并提高多节点训练效能。GPU 加速函式库如 cuDNN, cuBLAS, 和 TensorRT 为深度学习推理和高速计算 (HPC) 应用程序提供更高的效能。
原生执行标准程序语言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光线追踪,影片和图像处理,以及流体力学计算等技术。
单一无缝的 49 位虚拟地址空间可让数据在 CPU 和 GPU 完全分配的内存内透明的移动。
GPUDirect for Video 经由避免不必要的系统内存数据复制和 CPU 负担来加速 GPU 和影像 I/O 装置间的沟通。
M将系统正常运作时间最大化,无缝管理大规模部署并远程控制图形和显示设置,以实现高效率运作。
GPU 架构 | Turing |
CUDA 平行处理核心 | 4608 |
NVIDIA Tensor核心 | 576 |
NVIDIA RT 核心 | 72 |
内存 | 48 GB GDDR6 |
RTX-OPS | 84T |
光线投射 | 10 Giga Rays/Sec |
最高单精度 (FP32) 效能 | 16.3 TFLOPS |
最高单精度 (FP16) 效能 | 32.6 TFLOPS |
最高整数运算 (INT8) 效能 | 261.0 TOPS |
深度学习 TeraFLOPS1 | 130.5 Tensor TFLOPS |
内存接口 | 384-bit |
内存带宽 | 672 GB/s |
最大功耗 | 295 W |
总线 | PCI Express 3.0 x16 |
显示接头 | DP 1.4 (4) + VirtualLink (1) |
板型 | 4.4” 高 x 10.5” 长 双槽 |
重量 | 1.002 kg |
散热方案 | 主动式 |
NVIDIA® 3D Vision® 和 3D Vision Pro | 由 3 pin mini DIN 支持 |
框页锁 (Frame Lock) | 相容 (与 Quadro Sync II) |
NVLink 互连技术 | 100 GB/s |
1 FP16 矩阵乘以 with FP16 或 FP32 累加