2022-12-25 11:09 编辑:奔跑的小羊 点击: 次 A+
在这个“万物皆可AI”的时代,诸如“美颜滤镜”、“漫画脸特效”等平日里小小的娱乐,其实背后都离不开AI科学家们对机器和海量的数据的训练。因此,一台性能强悍的深度学习工作站是相关行业开发者们必不可少的工作利器。
惠普Z系列工作站作为面向全球各个行业内专业人士的硬件解决方案,深耕市场多年,在广大行业客户中建立了良好的口碑,今天我们评测的机器正是Z系列台式工作站中的最新旗舰——惠普 Z8 G4工作站,它配备了性能超高的硬件并有着强大的扩展性,旨在为机器学习用户带来更高的任务处理速度,下面就让我们一起看看它究竟有何过人之处吧!
硬件性能
首先来看一下整机的硬件配置,我们手中的这台机器配备了2个英特尔至强可扩展处理器,型号为至强银牌4210R,14nm工艺,10核20线程,基础频率2.4GHz,最大睿频3.2GHz,TDP为100W。
在CPU-Z测试中,单颗处理器的单核得分为369.0分,多核得分为5391.5分。
时间更长的Cinebench R23中,两颗处理器可以共同发力,最终单核得分829分,多核得分18779分。
单就处理器的理论性能来说,这样的表现已经达到了目前市面上的第一梯队,核心数多,已经足够运行各种大型应用程序了,如果用来剪辑视频也能有不错的导出速度。
作为面向人工智能训练推出的一款工作站,显卡的性能显然更加重要,惠普Z8 G4超大的机箱可在两颗处理器的基础上再容纳多块专业显卡,我们手中这一台就配备了多达4块的英伟达RTX A4000显卡。这款显卡采用GA104核心,8nm工艺,6144组CUDA核心,拥有16GB的GDDR6超大ECC显存以及256bit的显存位宽,最大功耗140W,性能相当炸裂。
其中,ECC功能的显存可以说是专业工作流程中的一大神器,不管是深度学习用户还是经典计算用户,都能通过这项功能减少长时间计算中出现的错误。
理论性能方面,这款显卡在3D Mark的Time Spy模式下得分为10967,Fire Strike模式下得分为26135,图形性能同样非常给力。
根据英伟达官方资料,这款显卡的单精度浮点性能为19.2TFLOPS,得益于其采用了节能高效的单插槽规格,我们手中这台配备了四块该卡的惠普Z8 G4可以提供高达76.8TFLOPS的浮点性能,非常给力。
尤其是在使用一些运算量不那么高,但是存储访问量的算法时,RTX A4000功耗更低,并且也没有运行效率上的限制,这些都是普通的高性能游戏卡所无法提供的。
存储方面,惠普Z8 G4提供了多达24个内存插槽以及4个机械硬盘仓,至高可提供1.5TB的ECC内存扩展以及56TB的海量存储空间,大幅提高复杂数据集的处理效率。
轻松搭建AI开发平台
这样强悍的硬件配备已经超出了绝大部分用户的认知,可以说,惠普Z8 G4是一台台式机外观下的超级计算机。因此,相较于个人计算机,它不单只为个人服务,还可以通过扩展,为一整个小团队搭建完整的开发平台。
为此,惠普推出了惠普AI开发平台,这是一个基于Docker+Kubernetes的人工智能容器云平台,通过管理界面和深度的资源调度,可让Z8 G4这样的数据科学工作站在后端提供强大的算力支撑,化身后端基础设施,通过网络中间层和应用服务层连接外部的移动工作站、笔记本电脑、台式机等各种设备,为一整个中小型AI开发团队提供完整的解决方案,提高人工智能创新和研发效率,可谓是“一人成军”。
在这样完备的软硬件配合下,惠普Z8 G4究竟能提供怎样的实际价值呢,下面这个案例或许能帮助大家更好地进行理解。
以目前比较主流的YOLO算法为例,分别对吸烟行为和打电话行为深度神经网路模型进行训练。可以看到,在输入640*640分辨率的图像时,数据集仅为309MB的情况下,2路服务器要进行14小时15分钟的训练,而采用惠普Z8 G4只用了6小时20分钟,时间是前者的一半还不到。即便是当数据集来到1.98GB,这一结果也没有改变,并且还大大提高了模型的准确率。
这样的情况足以展现惠普Z8 G4超强硬件带来的速度提升,基于惠普AI开发平台,我们可以把算力同步给其他终端使用,再配合高效的平台管理软件,能让算力最终同步到团队中的每一个人手中,从而大幅提高整体的工作效率。
总结
惠普Z8 G4拥有强悍的硬件配置和可扩展性,并且内部合理的风道设计和模块化结构带来了强大的稳定性,能长期为团队提供稳定的算力输出,非常适合高校实验室和创业公司等中小型AI开发团队使用。