发布日期 : 2021/08/18

案例分享 | NVIDIA虚拟GPU技术助力制造业搭建研发云平台


山推工程机械股份有限公司集团借助NVIDIA虚拟GPU技术搭建研发云平台,提高生产力、增强协作。

项目背景

山推工程机械股份有限公司(以下简称“山推”)属于国有股份制上市公司,是山东重工集团权属子公司。产品覆盖推土机系列、道路机械系列、混凝土机械系列、装载机系列、挖掘机系列等十多类主机产品和底盘件、传动部件、结构件等工程机械配套件,主要用于基础建设等土石方工程,高速铁路、桥梁建设,水利水电、高层建筑等方面。现年生产能力达到1万台推土机、6000台道路机械、500台混凝土搅拌站、15万条履带总成、100万件工程机械“四轮”、8万台套液力变矩器、2万台套变速箱。

经过多年的经营积累,山推在产品质量、市场知名度、用户口碑等各方所存在的强大品牌优势,维持了行业领军态势。

项目挑战

随着近年来各行各业对信息化的重视程度不断提高,产品制造商们正在引入大量前沿技术,从而减少成本、优化产品、加快开发周期,并提高项目团队的工作效率。在推进信息化和实现创新的过程中,山推也面临一些问题和挑战:

1.首先,在创建先进的产品设计流程中需要更强的生产力。以前可能只是简单地绘制一些图纸或者静态渲染,现在需要做实时渲染,以前只是做一些普通的科学计算,现在可能需要的是对海量的数据和图像进行深度学习处理,这一切都对硬件的运算和图形处理能力提出了更高的要求。

2.随着对算力需求的大幅度提升,成本也在快速上升,能够在保持算力的增长条件下,将成本有效的控制住的方案自然会变得非常有吸引力。另外除了显性的软硬件成本之外,还有一个隐形的运维成本的控制问题,海量的物理机设备往往会极大的消耗运维人力,所以通过高度标准化的部署方式来节省运维成本的虚拟化部署方式变得越来越有吸引力。

3.一场突如其来的全球疫情爆发,移动办公需求渐渐成为企业的刚需,在对图形密集型用例需求日益增长的情况下,如何应对复杂的工作负载对于IT团队而言是一项不小的挑战。

4.安全性的需要越来越强。尤其对于制造业企业而言,一次图纸的丢失可能就会带来毁灭性的灾难;基于物理机部署的方式虽然也有一些办法来提高安全性,但是如果能直接把所有数据都放到云上,无疑是对安全性质的提升。

解决方案

山推研发云平台项目最终采用了NVIDIA RTX虚拟工作站 (vWS)和NVIDIA虚拟PC(vPC)等虚拟GPU软件以及NVIDIA Quadro RTX™ 6000专业显卡部署了虚拟化环境,可以同时支持200个以上的员工在线体验媲美物理图形工作站的性能,即时查看和处理大型3D模型和图形密集型应用程序,并且通过对热迁移及高可用技术的支持,可以随时随地实现故障工作站的迁移,故障之后,随时能够恢复工作状态,极大的提高了应对故障的能力。

其中,NVIDIA RTX vWS能够将光线追踪和AI去噪等高级功能引入虚拟环境,将物理工作站的强大功能和性能提供给虚拟机(即使是在处理大型3D模型时也不例外),同时支持公司根据工作流程的要求动态分配计算资源。而NVIDIA Quadro RTX™ 6000则为整个虚拟环境和生产设计流程提供了出色的GPU加速性能。利用全新的AI、光线追踪和模拟SDK的功能,设计师能够高效地交付3D设计、实现高度逼真的渲染效果。RTX GPU中的专用Tensor核心和RT核心利用颠覆性的人工智能 (AI) 降噪技术,也大大缩短了生成渲染输出所需的时间。员工可以在设计工作流程期间实时直观查看设计修改实际呈现出的样子,以便立即做出更好且更明智的决策,而且还可以对产品进行精确的可视化模拟,更有效地传达设计意图。

影 响

  • 工作效率提升

NVIDIA RTX虚拟工作站可通过数据中心提供GPU资源让用户随时随地在任何设备上安全访问数据,用户不再受物理位置的限制,NVIDIA vWS能够进一步发挥RTX GPU的优势,实现真正的GPU加速数据中心,通过数据中心虚拟化应用程序为终端用户如我们的工程师和设计师提供专业工作站级别的用户体验。设计人员即使在外出差,也能够随时随地访问、查看设计图纸,实时协作,打破传统物理机部署的局限。

  • 工作质量提升

通过vGPU技术实现了GPU的灵活切分,可以更灵活地分配、最大化地利用昂贵的GPU资源;基于不同用户需求配置不同的虚拟GPU类型,重型设计用户采用vWS授权,轻载桌面用户采用vPC授权,这样既能节省成本又能很好的利用强大的GPU算力来辅助完成设计研发等工作。

  • 数据安全稳定性增强

所有机密数据均保存在数据中心,员工仅可使用。这样可以实现有效的数据安全,保护知识产权。员工采用双机方式,个人数据在本地物理机上,所有的关键的数据全部在虚拟机上,实现了机密数据的完全隔离。

  • 运维效率提升

虚拟化部署采用统一模板,虚拟机的生成和运维可以一键完成,极大地简化了部署的难度,虚拟机的快照机制、热迁移技术等也可以快速地从故障中恢复工作状态,对于山推这样至少部署数百台工作站的企业来说,通过虚拟化技术极大的提升了运维的效率,节省了运维人力。