APP下载

NVIDIAGTC2018直播摘要世上最大GPU与DGX-2AI超级电脑面世

消息来源:baojiabao.com 作者: 发布时间:2024-03-29

报价宝综合消息NVIDIAGTC2018直播摘要世上最大GPU与DGX-2AI超级电脑面世

近来显卡界都没什么新的家用产品, AMD 自从推出 Vega 56、Vega 64 后,就因蒙上延迟出货的阴霾,至非公版到货时,都没引起什么回响。而 NVIDIA 虽在去年 12 月发表新的 Volta 架构 GeForce TITAN V 显卡,但价钱极昂贵,又针对商用研究市场,最近还被揭发偶尔会运算错误,沦为笑柄。在掘矿的热潮下,不论 A 卡还是 N 卡,都被矿工大手扫货、炒高市价,令真正的砌机玩家叫苦连天。外界都一直都期望 NVIDIA 能于今天的 GTC( GPU Technology Conference )发表新的 Ampere 架构 GeForce GTX 2080 系列、或者是传闻的 Turing 架构掘矿专用卡,希望新气象能消除负面消息。然而“老黄” NVIDIA CEO 黄仁勋可能是想继续赚取掘矿热潮的丰厚利润,所以民众的“诉求”都没在 GTC 达成, GTX 2080 更据闻延期至夏天才有,今次在 GTC 发表的新技术都侧重于数据中心、 AI 深度学习、大型运算等商业范畴。(直播连结请按此)

2018 年的 NVIDIA GTC 大会侧重于 AI 发展等商业范畴。

2018 年的 NVIDIA GTC 大会侧重于 AI 发展等商业范畴

世上最大 GPU 与 DGX-2 超级电脑

大家先别按回上一页,虽则今年 GTC 的重点不在于家用砌机市场,但 NVIDIA 都发表了不少新颖的技术,其中“世上最大的 GPU”( The World’s Largest GPU )最为瞩目。很多时新推出的显卡都是史上最快的啦, NVIDIA 这样形容是否指体积大如桌面的显卡,然后内里有很多很多的晶体管,运算速度极快之类?可以说部分正确啦,因为这并不算是单一张显卡,而是把 16 张 Tesla V100 “串连融合”成一体,形成最大的 GPU ,放在一台叫做 DGX-2 的超级电脑中。所以其实这个“最大 GPU ”都没有正统的型号名字,它内里每张 V100 都具备 5,120 个 CUDA Core 、 32GB HBM2 内存(原本每张 16GB ,现在翻倍)、 900GB/s 内存带宽,再乘以 16 ,就会得出“最大 GPU” 81,920 个 CUDA Core 、 512GB HBM2 内存、 14.4TB/s 内存带宽的惊人规格。

世上最大的 GPU 是由 16 个 Tesla V100 GPU 组成。

世上最大的 GPU 是由 16 个 Tesla V100 GPU 组成

这样的话,自己组台服务器,再放 16 张 Tesla V100 都可以啦,为何要买 DGX-2 呢?其实重点在于接连这 16 块 GPU 的“超级胶水”,当中包含了 12 个崭新的 NVSwitch 技术“桥接”,那就可把 16 张 V100 连成一体、共享运算及内存资源,卡与卡之间又没什么延迟,运作上俨如一个极大的 GPU。

DGX-2 超级电脑配备“最大 GPU”以及高规格的硬件。

DGX-2 超级电脑配备“最大 GPU”以及高规格的硬件

那么也要有个特别设备,才能装得下如此独特的“最大 GPU ”吧?所以 NVIDIA 于 GTC 一并推出 DGX-2 的 AI 超级电脑,内里采用“最大 GPU ”,再配上 2 颗 Intel Xeon Platinum CPU 、 1.5TB 系统内存、 30TB NVMe SSD 、以及 100Gbps 以太网络,打造强大的深度学习、 AI 研究专用的服务器,运算性能高达 2 PetaFLOPS !(全球最快的超级电脑则为 125 PetaFLOPS , DGX-2 是要纳入全球最快的排行榜吗?)。相比传统的数据中心,DGX-2 大概只占 6U Server 柜,重量仅为 350lb ,耗电只有 10,000W ,卖 $399,000 美元(约 $3,112,200 港元),能为企业及科研中心省下不少数据中心地租、电力和运作成本,生产力又非常高,能于数分钟至数小时内,极速发掘出隐藏于大量资料中的模式,并把模式分析、转化为有用的知识。

金色那台就是 DGX-2,体积比数据中心细小得多,而左边就是拆开的模样。

金色那台就是 DGX-2,体积比数据中心细小得多,而左边就是拆开的模样。

新 Quadro GV100 增添 RTC 光影追踪技术

除了针对 AI 人工智能市场的“最大 GPU”和 DGX-2 外, NVIDIA 亦为图像处理的服务器绘图卡产品线推出新型号。继去年六月的 Tesla 级“ Tesla V100 ”后,今次就把 Volta 架构延伸至低一个档次的 Quadro 产品线,推出“ Quadro GV100 ”。 Quadro GV100 具备 5,120 个 CUDA Core 、 32GB HBM2 内存和 640 个 AI 运算用的 Tensor Core , Tensor 性能达 118TFLOPS 。再加上今年 NVIDIA 很爱用的相互串连概念,用 NVLink 串连两张 GV100 又可把规格翻倍!

NVIDIA Quadro GV100。Source:Videocardz

NVIDIA Quadro GV100。Source:Videocardz

用 NVLink 把两张卡串连起来,就能加倍规格。

用 NVLink 把两张卡串连起来,就能把规格加倍。

另外 GV100 也增添了 NVIDIA RTX 光影追踪技术( Ray Tracing Technology ),可于游戏和多媒体中实时造出仿如拍摄电影般迫真的光影效果。当中要计算光源射进来,环境中每一个物件应该是哪些位置最光,物件用的物料会如何影响反光效果,以及人物望着环境的视角等等,现在 GV100 能实时计算那么多复杂的数据,确实是科技的一大进步,未来大家玩线上游戏,也可能会有更迫真的光线倒影效果,看以下影片就能明白。

Tesla V100 获规格升级

另外刚才所提及的 Tesla V100 GPU ,在今次的 GTC 大会亦能获得规格提升。内存由原本的 16GB HBM2 升级至 32GB HBM2 ,与新出的 Quadro GV100 看齐。

两种 Tesla V100 都能升级至 32GB RAM。

两种 Tesla V100 都能升级至 32GB RAM

NVIDIA GTC 2018 小结

虽然今次的 NVIDIA GTC 大会都没有回应一般用家的砌机游戏卡与掘矿方面的需求,但 NVIDIA 展示了“最大 GPU ”、 DGX-2 、 Quadro GV100 、 RTX 等多种新技术,为数据中心、深度学习和 AI 范畴带来技术性的突破,开创新局面与发展机遇。

NVIDIA CEO 黄仁勋于 GTC 发表了多项崭科技术。

NVIDIA CEO 黄仁勋于 GTC 发表了多项崭科技术

Source:NVIDIA GTC 2018 直播

2018-03-28 17:32:00

相关文章