NVIDIA RTX™ 4000 Ada Generation 是专业人士最强大的单插槽 GPU,与上一代产品相比,在速度和功耗方面实现巨大突破,可在桌面型工作站中处理严格要求的创意、设计和工程工作流程。 RTX 4000 利用最新一代 RT 核心、Tensor 核心和 CUDA® 核心以及 20GB 显存,使专业人士能够创造复杂的产品工程、梦幻般的城市景观和身临其境的娱乐体验。 凭借其高能效的单插槽设计,RTX 4000 可无缝融入各种工作站机箱,为专业人士提供无限潜力。
利用多个 GPU 以动态扩展图形性能、增强图像质量、扩展显示空间并可组合完全虚拟化的系统。
将桌面和应用程序从单一工作站扩展到最多 4 个 GPU 和 16 个显示器,同时提供完整的性能和影像质量。
每张卡支持最多四个 5K 显示器 @ 60Hz,或两个 8K 显示器 @ 60Hz 。RTX 4000 支持 HDR 色彩,包括 4K @ 60Hz 10/12b HEVC 解碼以及高达 4K @ 60Hz 10b HEVC 编码。 每个 DisplayPort 显示输出可驱动 4096x2160 @ 120 Hz 的超高分辨率及 30-bit 色彩。
终端用户可获得前所未有的桌面体验控制权,从而在单个大型显示器或多显示器环境中提高生产率,特别是在当前大型、宽屏显示器时代。
在单一系统的 8 个 GPU 中同步最多 32 个显示器2的显示和画面输出 (通过两张 Sync II 适配卡连接),减少建立高阶影像可视化环境所需的机器数量。
为专业应用程序提供流畅与身临其境的 3D 立体体验。
在最大 32K 桌面大小的高分辨率显示器上获得更多 Mosaic 拓扑选择。
稳定控制三维效果,通过专属连接直接将 3D 立体硬件同步到 NVIDIA RTX 显卡。
NVIDIA RTX Experience为您的桌面工作站提供了一套生产力工具,包括高达 8K 的录制,针对最新 NVIDIA RTX Enterprise 驱动程序更新的自动提报以及访问游戏功能。该应用程序可于此下载。
深度学习框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快训练时间并提高多节点训练性能。GPU 加速函式库如 cuDNN, cuBLAS, 和 TensorRT 为深度学习推理和高速计算 (HPC) 应用程序提供更高的性能。
原生执行标准程序语言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,可以加速光线追踪,影片和图像处理,以及流体力学计算等技术。
单一无缝的 49 位虚拟地址空间可让数据在 CPU 和 GPU 完全分配的内存内透明的移动
GPUDirect for Video 通过避免不必要的系统内存数据复制和 CPU 负担来加速 GPU 和影像 I/O 设备间的沟通。
将系统正常运作时间最大化,无缝管理大规模部署并远程控制图形和显示设置,以实现高效率运作。
GPU 架构 | NVIDIA Ada Lovelace 架构 |
CUDA 并行处理核心 | 6144 |
NVIDIA Tensor 核心 | 192 |
NVIDIA RT 核心 | 48 |
单精度性能1 | 26.7 TFLOPS |
RT Core 性能1 | 61.8 TFLOPS |
Tensor 性能1 | 427.6 TFLOPS2 |
GPU 显存 | 20 GB GDDR6 支持 ECC |
显存位宽 | 160-bit |
显存带宽 | 360 GB/s |
最大功耗 | 130W |
系统接口 | PCI Express 4.0 x16 |
显示接口 | DP 1.4 (4) |
外形规格 | 4.4” H x 9.5” L 单插槽 |
产品重量 | 528g |
散热方式 | 主动式 |
NVIDIA® 3D Vision® 与 3D Vision Pro | 支持 3-pin mini DIN |
同步输出 | 支持 Quadro Sync II |
NVLink 互连技术 | 不支持 |
NVENC | NVDEC | 2x | 2x (+AV1 编码与解码) |
1基于 GPU 加速频率的峰值数据量
2使用新的稀疏性功能得到更有效率 TOPS / TFLOPS