• 加入比较表

NVIDIA L40S

  • NVIDIA Ada Lovelace 架构
  • 48GB GDDR6 显存(具备 ECC 纠错码)
  • 18,176 CUDA 核心
  • 142 RT核心
  • 568 Tensor 核心
  • 最大功耗:300W
  • 被动式散热
  • 外形尺寸:11.18 cm(高)x 26.67 cm(长),双插槽
  • 支持虚拟化 vGPU 软件
  • 信任根技术提供安全启动功能
  • 支持NEBS

NVIDIA L40S

为数据中心提供出色的 AI 和图形性能

功能强大的通用型 GPU

NVIDIA L40S GPU 可为您提供突破性的多工作负载性能体验。L40S GPU 结合强大的 AI 计算性能与出色的图形和媒体加速功能相结合,旨在为新一代数据中心工作负载提供支持,从生成式 AI 和大型语言模型 (LLM) 推论与训练,到 3D 图形、渲染和视频,都能应对自如。

采用 NVIDIA Ada Lovelace 架构

第四代 Tensor 核心

针对结构化稀疏和优化的 TF32 格式提供硬件支持,为 AI 和数据科学模型训练提供开箱即得的性能提升。可利用 DLSS 技术加速 AI 增强型图形功能,从而在特定应用中提供更高的分辨率和更出色的性能。

第三代 RT 核心

增加的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,从而加快产品设计以及建筑、工程和施工工作流程的渲染。可利用硬件加速的动态模糊技术提供令人惊艳的实时动画效果,呈现栩栩如生的动态设计。

CUDA 核心

加速单精度浮点(FP32)吞吐量和更高的能效,可显著提升 3D 模型开发和计算机辅助工程(CAE)仿真等工作流程的性能。可使用增强的 16-bit Math Capability(BF16)支持混合精度工作负载。

Transformer Engine 引擎

Transformer 引擎可显著加速 AI 性能,并提高训练和推理的内存利用率。凭借 Ada Lovelace 第四代 Tensor Core 的强大功能,Transformer 引擎可以智能地扫描 Transformer 架构神经网络的各个层,并在 FP8 和 FP16 精度之间重新转换,从而提供更快的 AI 性能并提升训练和推理的速度。

效率及安全性

L40S GPU 专为 24 小时全天候的企业数据中心运营量身打造并进行了优化,经过 NVIDIA 的精心设计、构建、测试和支持,可确保更大限度地提高性能、耐用性和正常运行时间。L40S GPU 符合新数据中心标准,支持网络设备构建系统(NEBS)3 级标准,并且采用了信任根技术实现安全启动,可为数据中心提供额外的安全保护。

DLSS 3

L40S GPU 可借助 NVIDIA DLSS 3 实现超快渲染和更高帧率。这项突破性的帧生成技术利用深度学习及 Ada Lovelace 架构和 L40S GPU 中的新一代硬件创新技术(包括第 4 代 Tensor Core 和光流加速器)来提升渲染性能,在提高每秒帧数(FPS)的同时显著降低延迟。

通用性能

Tensor 性能

1,466 TFLOPS1

RT Core性能

212 TFLOPS

单精度性能

91.6 TFLOPS

1峰值速率基于 GPU 加速频率。

多工作负载加速

生成式 AI

生成新的服务、见解和原创内容

L40S 搭载新一代 AI、图形和媒体加速功能,可提供比上一代 NVIDIA A40 高 5 倍, 比 NVIDIA HGX™ A100 高 1.2 倍的推理性能。L40S 具备突破性的性能和 48GB 的显存容量,是加速多模态生成式 AI 工作负载的理想平台。

深入了解生成式 AI

大语言模型训练和推理

加速 AI 训练和推理工作负载

第四代 Tensor Core 支持 FP8,可提供出色 AI 计算性能,帮助加速先进的大语言模型和生成式 AI 模型的训练和推理。

探索 NVIDIA AI 推理的优势

渲染和 3D 图形

NVIDIA RTX 显卡为高保真创意工作流程提供强劲动力

第三代 RT Core 可提供高达上一代产品 2 倍的实时光线追踪性能,从交互式渲染到实时虚拟制作,均可助力打造令人惊艳的视觉内容和高保真创意工作流程。

详细了解 NVIDIA RTX 技术

NVIDIA Omniverse

创建和运行元宇宙应用

NVIDIA Omniverse 为连接、开发和运行新一代工业数字化应用提供了理想的平台。L40S 具备强大的 RTX 图形和 AI 功能,为建立基于通用场景描述(OpenUSD)的 3D 内容和基于 Omniverse 的仿真工作流程提供出色性能。

详细了解 NVIDIA Omniverse

与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。

GPU 架构 NVIDIA Ada Lovelace
CUDA 核心 18,176
Tensor 核心 568
RT 核心 142
FP32 (TF) 91.6
TF32 Tensor 核心 (TF) 183 I 366*
BFLOAT16 Tensor 核心 (TF) 362.05 I 733*
FP16 Tensor 核心 (TF) 362.05 I 733*
FP8 Tensor 核心 (TF) 733 I 1,466
INT8 Tensor 核心 (TOPS) 733 I 1,466
INT4 Tensor 核心 (TOPS) 733 I 1,466*
RT 核心 (TF) 209
编码/解码引擎 3 NVENC (+AV1)
3 NVDEC
4 NVJPEG
GPU 显存 48GB GDDR6 ECC
显存带宽 864GB/s
显存位宽 384-bit
NVLink 互连技术 不支持
Multi-Instance GPU (MIG) 不支持
虚拟 GPU 软件 支持
支持 NEBS 是 / 3 級
散热 被动式
显示接口 4x DisplayPort 1.4a
最大功耗 350W
系统接口 PCI-E 4.0 x16
外形尺寸 4.4” H x 10.5” L, 双插槽

* 具有稀疏性


  • 本网站所提到的产品规格及资讯,若有变动恕不另行通知,一切以购买产品彩盒上的标示为准。
  • 上述商品规格仅供参考,实际规格以实物为准,丽台科技保留修改的权利。上市商品将视各区市场状况而异,请与您的供应商确认实际出货产品。
  • 本网页所标示附赠的转接器、电缆和软件等资讯仅供参考,丽台保有调整变动的权利,若有更动恕不另行通知。
  • 上述提及的所有品牌及产品名称皆为各所属公司的商标。