为数据中心提供出色的 AI 和图形性能
NVIDIA L40S GPU 可为您提供突破性的多工作负载性能体验。L40S GPU 结合强大的 AI 计算性能与出色的图形和媒体加速功能相结合,旨在为新一代数据中心工作负载提供支持,从生成式 AI 和大型语言模型 (LLM) 推论与训练,到 3D 图形、渲染和视频,都能应对自如。
针对结构化稀疏和优化的 TF32 格式提供硬件支持,为 AI 和数据科学模型训练提供开箱即得的性能提升。可利用 DLSS 技术加速 AI 增强型图形功能,从而在特定应用中提供更高的分辨率和更出色的性能。
增加的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,从而加快产品设计以及建筑、工程和施工工作流程的渲染。可利用硬件加速的动态模糊技术提供令人惊艳的实时动画效果,呈现栩栩如生的动态设计。
加速单精度浮点(FP32)吞吐量和更高的能效,可显著提升 3D 模型开发和计算机辅助工程(CAE)仿真等工作流程的性能。可使用增强的 16-bit Math Capability(BF16)支持混合精度工作负载。
Transformer 引擎可显著加速 AI 性能,并提高训练和推理的内存利用率。凭借 Ada Lovelace 第四代 Tensor Core 的强大功能,Transformer 引擎可以智能地扫描 Transformer 架构神经网络的各个层,并在 FP8 和 FP16 精度之间重新转换,从而提供更快的 AI 性能并提升训练和推理的速度。
L40S GPU 专为 24 小时全天候的企业数据中心运营量身打造并进行了优化,经过 NVIDIA 的精心设计、构建、测试和支持,可确保更大限度地提高性能、耐用性和正常运行时间。L40S GPU 符合新数据中心标准,支持网络设备构建系统(NEBS)3 级标准,并且采用了信任根技术实现安全启动,可为数据中心提供额外的安全保护。
L40S GPU 可借助 NVIDIA DLSS 3 实现超快渲染和更高帧率。这项突破性的帧生成技术利用深度学习及 Ada Lovelace 架构和 L40S GPU 中的新一代硬件创新技术(包括第 4 代 Tensor Core 和光流加速器)来提升渲染性能,在提高每秒帧数(FPS)的同时显著降低延迟。
1,466 TFLOPS1
212 TFLOPS
91.6 TFLOPS
L40S 搭载新一代 AI、图形和媒体加速功能,可提供比上一代 NVIDIA A40 高 5 倍, 比 NVIDIA HGX™ A100 高 1.2 倍的推理性能。L40S 具备突破性的性能和 48GB 的显存容量,是加速多模态生成式 AI 工作负载的理想平台。
第四代 Tensor Core 支持 FP8,可提供出色 AI 计算性能,帮助加速先进的大语言模型和生成式 AI 模型的训练和推理。
第三代 RT Core 可提供高达上一代产品 2 倍的实时光线追踪性能,从交互式渲染到实时虚拟制作,均可助力打造令人惊艳的视觉内容和高保真创意工作流程。
NVIDIA Omniverse™ 为连接、开发和运行新一代工业数字化应用提供了理想的平台。L40S 具备强大的 RTX 图形和 AI 功能,为建立基于通用场景描述(OpenUSD)的 3D 内容和基于 Omniverse 的仿真工作流程提供出色性能。
与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。
GPU 架构 | NVIDIA Ada Lovelace |
CUDA 核心 | 18,176 |
Tensor 核心 | 568 |
RT 核心 | 142 |
FP32 (TF) | 91.6 |
TF32 Tensor 核心 (TF) | 183 I 366* |
BFLOAT16 Tensor 核心 (TF) | 362.05 I 733* |
FP16 Tensor 核心 (TF) | 362.05 I 733* |
FP8 Tensor 核心 (TF) | 733 I 1,466 |
INT8 Tensor 核心 (TOPS) | 733 I 1,466 |
INT4 Tensor 核心 (TOPS) | 733 I 1,466* |
RT 核心 (TF) | 209 |
编码/解码引擎 | 3 NVENC (+AV1) 3 NVDEC 4 NVJPEG |
GPU 显存 | 48GB GDDR6 ECC |
显存带宽 | 864GB/s |
显存位宽 | 384-bit |
NVLink 互连技术 | 不支持 |
Multi-Instance GPU (MIG) | 不支持 |
虚拟 GPU 软件 | 支持 |
支持 NEBS | 是 / 3 級 |
散热 | 被动式 |
显示接口 | 4x DisplayPort 1.4a |
最大功耗 | 350W |
系统接口 | PCI-E 4.0 x16 |
外形尺寸 | 4.4” H x 10.5” L, 双插槽 |
* 具有稀疏性