0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

选择GPU服务器需要考虑哪些情况如何才能提升GPU存储性能

Wildesbeast 来源:网络整理 作者:佚名 2021-02-08 17:37 次阅读

GPU是我们常用器件,采用GPU,才使得图形显示成为可能。在上期文章中,小编对GPU的加速原理等知识有所阐述。为增进大家对GPU的认识,本文将基于两点介绍GPU:1.选择GPU服务器需要考虑哪些情况,2.如何提升GPU存储性能。如果你对GPU具有兴趣,不妨继续往下阅读哦。

一、如何选择GPU服务器

当GPU型号选定后,再考虑用什么样GPU的服务器。这时我们需要考虑以下几种情况:

第一、在边缘服务器上需要根据量来选择T4或者P4等相应的服务器,同时也要考虑服务器的使用场景,比如火车站卡口、机场卡口或者公安卡口等;在中心端做Inference时可能需要V100的服务器,需要考虑吞吐量以及使用场景、数量等。

第二、需要考虑客户本身使用人群和IT运维能力,对于BAT这类大公司来说,他们自己的运营能力比较强,这时会选择通用的PCI-e服务器;而对于一些IT运维能力不那么强的客户,他们更关注数字以及数据标注等,我们称这类人为数据科学家,选择GPU服务器的标准也会有所不同。

第三、需要考虑配套软件和服务的价值。

第四、要考虑整体GPU集群系统的成熟程度以及工程效率,比如像DGX这种GPU一体化的超级计算机,它有非常成熟的从底端的操作系统驱动Docker到其他部分都是固定且优化过的,这时效率就比较高。

二、如何提升GPU存储性能

要获得最佳的GPU存储性能,就需要根据业务目标对基础架构进行微调。这里有三种方法可供考虑。

1.大规模调整性能

AI部署的快速增长和ML训练数据集的大小增加了计算基础架构的负担,STFC(The Science and Technology Facilities Council )则是这种典型的代表。尽管STFC已添加了高端GPU服务器以提供更高的计算支持,但STFC缺乏在数百个Researchers 中扩展资源所需的企业级存储功能。

通过在具有RDMA功能的高速网络(例如Infiniband或融合以太网(RoCE)v2上的RDMA)上实现NVMe-over-Fabrics协议,大型AI / ML用户组(例如STFC)可以虚拟化NVMe SSD在各种服务器上未使用的存储资源池,因此它们的性能就像在本地一样。通过这样做,可以在一个小时内完成机器学习培训任务,而以前则需要三到四天。即使具有复杂的模型训练任务,GPU存储也不再是瓶颈。

2.在并行文件系统下使用NVMe池化存储

当AI和ML应用程序涉及从许多GPU服务器访问大量小文件时,作为存储基础架构就必须部署并行分布式文件系统。并行文件系统还使存储更容易实现大多数AI / ML使用所需的高吞吐量和低延迟。在并行文件系统下具有快速、灵活的池化NVMe存储,可以改善对元数据的处理,从而实现更高的读取性能和更低的延迟,从而提高GPU服务器的利用率。

例如,一家超大型威廉希尔官方网站 提供商最近推出了一种AI解决方案,用于预估保险公司使用的车辆碰撞场景。为了开发应用程序背后的AI逻辑,应用程序工作流涉及培训模型,方法是摄取多达2000万个小文件数据集,其中每个文件大小在150-700 KB之间。数据提取通常每8小时以100万个文件的速度或者每个客户端每秒最多35,000个文件进行。

通过在并行分布式文件系统下使用池化NVMe存储方法,该威廉希尔官方网站 提供商消除了它遇到的存储瓶颈,并将存储性能提高了3-4倍。

3.检查特定于GPU的“高速公路”

新的数据中心架构正在以统一的方式提高服务器、网络和存储的性能。一种类似的方法于2019年秋季首次亮相,它将来自多个供应商的基础架构元素与GPU优化的网络和存储进行集成,以在GPU内存和存储之间打开直接的数据通道,从而完全绕开CPU。这使数据能够在GPU、存储和网络设备提供的“开放高速公路”上进行传输,从而实现了对NVMe企业级卓越性能的无障碍访问。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    3808

    浏览量

    125079
  • 服务器
    +关注

    关注

    11

    文章

    6869

    浏览量

    81563
  • AI
    AI
    +关注

    关注

    87

    文章

    23881

    浏览量

    261085
收藏 人收藏

    评论

    相关推荐

    GPU

    性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理(CPU)、图形处理(GPU)、Cell类型架构以及数字信号处理
    发表于 01-16 08:59

    RDSH高清媒体的使用需要GPU吗?

    GPU? - 如何计算每个用户所需的内存(以及所需的GPU)? - 每台服务器有多少用户? - 您推荐哪种GPU用于此类用途? - 需要什么类型的许可?设置信息:所有
    发表于 09-27 15:56

    PyTorch教程23.5之选择服务器GPU

    选择服务器GPU.pdf》资料免费下载
    发表于 06-06 09:17 0次下载
    PyTorch教程23.5之<b>选择</b><b>服务器</b>和<b>GPU</b>

    gpu服务器是干什么的_gpu服务器和普通服务器有什么区别

    GPU服务器服务器当中的一种,GPU服务器跟其他服务器有什么区别ne?GPU服务器比其他服务器好用吗?下面我将带大家了解GPU服务器GPU服务器,简单来说就是基
    发表于 01-06 09:58 4.3w次阅读

    如何为深度学习选择 GPU 服务器?_目前哪里可以租用到GPU服务器?_gpu服务器出租价格

    服务器是网络中的重要设备,要接受少至几十人、多至成千上万人的访问,因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。所以说CPU是计算机的“大脑”,是衡量服务器性能的首要指标。如何为深度学习选择 GPU 服务器呢?目前哪里可以租用
    发表于 01-06 10:25 1.8w次阅读
    如何为深度学习<b>选择</b> <b>GPU</b> <b>服务器</b>?_目前哪里可以租用到<b>GPU</b><b>服务器</b>?_<b>gpu</b><b>服务器</b>出租价格

    选择GPU服务器的基本原则有哪些

    选择GPU服务器的基本原则之前,先来跟大家介绍下常见的GPUGPU服务器
    的头像 发表于 02-24 13:29 2556次阅读

    选择GPU服务器需要注意哪些方面

    GPU服务器主要应用于科学计算、视频编解码等不同场景领域。它可以为应用提供非凡的加速计算能力,可以将应用程序计算密集的工作负载转移到GPU
    的头像 发表于 03-13 17:25 2749次阅读

    GPU服务器到底是什么?GPU服务器与普通服务器到底有什么区别

    服务器具备很强的现实意义,我们每天都在无形中跟服务器打交道。针对用途不同,服务器可分为诸多类型。为增加大家对服务器的了解程度,本文将对GPU服务器予以介绍。通过本文,您将对GPU服务器GPU服务器和普通
    的头像 发表于 11-14 10:04 6505次阅读

    GPU服务器的详细介绍和工作原理说明

    服务器是基于GPU的应用于视频编解码、深度学习、科学计算等多种场景的快速、稳定、弹性的计算服务,我们提供和标准云服务器一致的管理方式。出色的图形处理能力和高性能计算能力提供极致计算性能,有效解放计算压力,提升产品的计算处理效率与竞争力。
    的头像 发表于 11-28 10:01 6153次阅读

    热虹吸散热威廉希尔官方网站 解决GPU服务器散热问题

    GPU威廉希尔官方网站 的加持之下,需要强大的GPU算力解析。无论是GPU服务器,还是GPU工作站都趋向于小型化、模块化、高集成度
    发表于 10-09 14:11 1370次阅读

    GPU服务器处理性能和用例的说明

    GPU服务器处理性能和用例: 1、GPU 用例 虽然投资 GPU 服务器的原因过于广泛,无法在一篇文章中涵盖,但我们已经概述了我们在过去几年中看到的最喜欢的用例。 2、3D处理 GPU 服务器非常适合 2D 和 3D 计算以及渲染 3D
    的头像 发表于 02-22 16:44 1215次阅读

    GPU服务器是什么

    GPU服务器呢,今天我们就一起了解一下。 GPU服务器,简单来说,GPU服务器是基于GPU的应用于视频编解码、深度学习、科学计算等多种场景的快速、稳定、弹性的计算服务,我们提供和标准云服务器一致的管理方式。出色的图形处理能
    的头像 发表于 02-25 09:31 4361次阅读

    GPU服务器与FPGA云服务器的区别介绍

    GPU服务器(GPU Cloud Computing)是基于 GPU 应用的计算服务,具有实时高速的并行计算和浮点计算能力,适应用于 3D 图形应用程序、视频解码、深度学习、科学计算等应用场景。我们提供和标准云服务器一致的管理方式,有效解放您的计算压力,
    的头像 发表于 03-11 09:48 1060次阅读

    为什么需要专门出现GPU处理图形工作?GPU服务器有什么作用?

    GPU服务器有什么作用? GPU 加速计算可以提供非凡的应用程序性能,能将应用程序计算密集部分的工作负载转移到 GPU,同时仍由 CPU 运行其余程序代码。 从用户的角度来看
    的头像 发表于 07-07 10:15 211次阅读

    GPU服务器是什么?

    选择GPU服务器GPU服务器有什么作用? GPU加快计算能够提供不凡的应用软件性能,能将应用软件计算聚集一部分的工作中负荷迁移到GPU,另外仍由CPU运作其他编程代码。从客户的视角看来,应用软件的运作速率显著加速. 了解
    的头像 发表于 08-01 18:03 141次阅读