GPU资源的选择

近年来,深度学习、人工智能等高深名词越来越频繁的出现在大众面前,相关的算法和应用也逐步在实际生活中出现和应用(例如人脸识别、智慧交通等等)。尤其是在计算机视觉、自然语言处理等领域等进展尤为显著。而这其中的相关模型建模和训练测试等场景,都不得不依赖于GPU的强大计算能力,目前仍然是以Nvidia的CUDA(Compute Unified Device Architecture)平台为主。

但是如果作为个人兴趣爱好或者小团队来学习研究,要配置这样一台高性能的计算设备也是比较高昂的,从几万至十几万都有可能。因此如何从经济和使用需求双方面的角度来合理选择GPU资源成为一件非常重要的事情。首先而言,需要面临一个选择:是直接购买硬件进行配置,还是从GPU云平台中获取计算资源。接下来我们简单分析各自的利弊:

1、直接购买硬件进行采购

优势:自然不必多说,设备硬件实打实的放在那里,看得见摸得着,而且完全归自己支配掌握,可以随心所欲的做各种建模运算和算法验证,一个字:爽!​

缺点:也很明显,经济代价比较大,成本相对较高。而且如果是工作站/服务器,则普遍存在噪音大(导致无法放在办公环境中),电力消耗比较多。如果是自己动手组装,那么对于自己自身的动手能力要求较高,而且稳定性相对较差。​

尤其是需要注意的是:因为GPU功率比较大,需要配备大功率的电源才能更为稳定可靠,否则容易因为电源功率不足导致硬件损伤。硬盘性能对于整体性能影响较为显著,建议采用固态硬盘或者是并行存储方案。​

具体的硬件配置和选型,笔者此处不做具体推荐,一则是因为硬件在不断升级改造,例如笔者经历了从RTX 1080Ti,到RTX 2080Ti,然后到RTX 3080Ti,所以此处推荐具体的硬件型号意义不大,另外硬件性能能够满足一定时间内实际需求即可,不必时刻追随新硬件的出现就立刻更换(除非钱袋子很满,不差钱)。另外就是实际需求不一样,成本预算也不一样,所以也无从统一推荐配置。​

此处可以参考https://zhuanlan.zhihu.com/p/113340612?ivk_sa=1024320u 等文章,或者直接百度查找最新的相关文章予以借鉴。​​

2、从GPU云平台获取计算资源

这种方式简单实用,如果计算需求不是很多,可以考虑此种方式,经济实惠。​

网上有相关网友推荐,例如:​

Colab平台,是Google提供的免费云平台。​

Kaggle 机器学习算法大赛平台​

以及网友推荐的国内相关平台,部分可以参考如下连接:​

https://zhuanlan.zhihu.com/p/147889999

综上所述,在决定采取哪种方式之前,建议先好好了解具体的需求,看看有多少预算,从而做出合理的选择。

此条目发表在深度学习分类目录,贴了, 标签。将固定链接加入收藏夹。

发表回复