APP下载

【直击GTC2016】Nvidia首款AI专用超级电脑问世,效能等同250台x86服务器组成的运算丛集

消息来源:baojiabao.com 作者: 发布时间:2024-03-29

报价宝综合消息【直击GTC2016】Nvidia首款AI专用超级电脑问世,效能等同250台x86服务器组成的运算丛集

【美国圣荷西直击GTC 2016】Nvidia 2016年度GTC技术大会今天正式迈入第2天,Nvidia首席执行官黄仁勋亲自揭开大会序幕,就像去年的深度学习(Deep Learning )掀起大会热潮一样,今年所有话题也聚焦在深度学习与人工智能(AI)的技术应用 ,连现场发布的众多GPU新品也都纷纷与深度学习和AI应用有关,甚至Nvidia还在今年首度发表世上第一台AI专用的DGX-1超级电脑。

有别于去年GTC活动给人还是一场GPU技术大会的氛围,但今年却很不一样,深度学习和AI成为会场上最炙手可热的技术话题,连黄仁勋在今年主题演说中也数度谈到深度学习即将带来各产业的颠覆性变革。

他表示 ,五年前,他和团队就开始跨入深度学习领域,这些年也见证了深度学习技术的迅速窜红,而随着硬件和云端运算技术的成熟,他认为,深度学习不再只是一种App或是算法,更将开启一种前所未有的全新运算模式(Computing Model),这也将促使深度学习成为未来所有企业甚至每个人,都不能加以忽视的重要大事(Big Deal )。

他说,现在包括亚马逊AWS、Google、IBM,以及微软这几大云端巨头近年来都纷纷抢攻深度学习领域,可以想见的是,未来将会有更多结合云端的AI服务或应用陆续推出,甚至将带来新的一种AI即平台(AI-as-a-Platform)的崭新服务模式。

所以,Nvidia这次发布的多款GPU新品也纷纷围绕着深度学习与AI应用,甚至还推出了世上首款结合深度学习使用的超级电脑DGX-1。在这台超级电脑当中采用了Nvidia新Pascal架构的Tesla P100显卡系列,这也是在本次大会上所发表的最新一款服务器专用的GPU加速器产品,比前一代Maxwell架构的GPU加速器,在用来训练神经网络的效能方面,足足有提升12倍之多,并也支援了HBM2高带宽显示内存技术。

在这台超级电脑核心部分,总共装入8张各内建16GB内存的Tesla P100显卡和配置了一个2路Xeon E5 2698 v3处理器,而在系统内存部分最大可支援512GB DDR4的内存容量。Nvidia宣称,DGX-1使用于深度学习的运算吞吐量,在半精准度的条件下,DGX-1电脑每秒浮点运算次数能达到170TFLOPS,如此高度的运算能力,几乎等同于用250台x86服务器而搭建的运算丛集规模,才能满足AI所需的大规模运算的需求。此外,每台DGX-1机器的总传输带宽,每秒最高可达768GB。

 

另外若单用一个2路Xeon E5服务器与DGX-1进行两相测试比较的话,根据测试的结果,在做为AlexNet机器学习的模型训练方面,DGX-1完成训练所花费的时间要远比Xeon E5服务器还快许多,Xeon级服务器得要花150小时才能做完的事,DGX-1只须2小时就能完成训练。若以照片来举例的话,所代表的是,每天被喂给机器做训练的照片数量就有高达13亿张。


此外,这台超级电脑内也配备有7TB的SSD硬盘,而电力供给部分则是使用一台3U高度3,200瓦的电源供应设备,并也支援了NVLink 混合式立方网格 (NVLink Hybrid Cube Mesh),可提供更高速GPU互连的能力,网络部分则提供了双10GbE连接埠和一个100Gb的Quad InfiniBand高速网络界面。

不仅如此,DGX-1也支援许多新的软件功能,像是有装入Nvidia新深度学习绘图显示训练系统(Deep Learning GPU Training System ,DIGITS),用来协助企业设计一个完整且互动的神经网络,此外,还加入了新释出的 CUDA深度神经网络图库(CUDA Deep Neural Network library ,cuDNN )的v5新版本,可用来做为设计神经网络可供GPU加速的函数图库。DGX-1系统内也提供了一些深度学习优化的框架,例如Caffe、 Theano ,以及Torch等,也搭配一套云端管理存取的工具,还有更新的软件,以及一个容器应用储存库(Repository )。

Nvidia目前也与位于波士顿的麻省综合医院的临床数据科学中心 (Massachusetts General Hospital) 合作,将该研究中心所存有的100亿张的医学影像和医疗等相关资讯,都提供DGX-1用于进行深度学习的训练,以建构可预测的医疗演算模型。黄仁勋也宣布这台DGX-1今年6月将于美国推出上市,每台售价为129,000美元,此外,黄仁勋表示,一些主流的服务器大厂,包括HP、IBM、Dell等未来都将推出搭载Tesla P100显卡的服务器,预计在2017年第一季上市。

2018-01-30 01:25:00

相关文章