APP下载

在人工智能、超级计算机等领域开花结果 通用计算技术是什么?

2019-07-09 04:48

GPGPU,简称通用计算技术,是一种让显卡来参与本来CPU计算任务的技术,它从提出到现在不过十余年时间,但是发展堪称神速,本期超能课堂就带大家来了解一下这项技术,并寻找在我们身边GPGPU的应用。

什么是GPGPU

举个最经典的例子,在十多年前,高清视讯刚流行起来的时候,当时编码高清视讯对于当时的电脑来说,还是一件很困难的事情。视讯编码过程中,大部分运算都是浮点型别的,而GPU对于这种型别的计算相当拿手,计算起来量又大又快,所以人们就想到,能不能利用GPU来编码高清视讯。正巧当时业界的研究重点转向了GPGPU,英伟达第一个推出了一套比较完整的解决方案,将原本使用CPU的运算搬到了GPU之上,使得视讯编码速度比原先快了几倍之多。如果有DIY资历比较老的读者可能还依稀记得,当时许多文章都介绍如何使用显卡加速解码蓝光视讯,对于视讯的编解码加速,便是最早离我们距离最近的GPGPU应用。

为什么要GPGPU呢?

CPU因为有着通用性的需求,所以往往它上面单个核心会设计的非常大而全面,并且由于CPU计算的特性,核心中很大一部分面积用来构建快取(一个核心中往往有L1和L2两级快取)和控制单元(解码器与分支预测等前端单元),而实际用来运算的单元面积可能仅仅只占整个核心的一半甚至不到(如图)。种种原因使得CPU没有办法做非常大的规模,一个核心中能塞入的东西有限,而总体的核心数需要控制在一个合理范围中,多了就可能会发生各种各样的问题。

八核Coffee Lake的核心图,可以看到四个核心的面积已经接近右边的整合GPU

而GPU的设计理念就不一样了,本身图形计算就是一项简单而暴力的“粗活”,复杂度远不如CPU要负责的各种各样不同型别的活,想要提高图形计算速度的一个很简单的办法就是扩大处理器中含有的单元数量。所以GPU对于特定的计算任务,因为有着更大的计算单元,所以很容易就可以达到比CPU更高的计算速度,表现出来就是现在的GPU在浮点运算吞吐量上远超CPU。

CPU与GPU在构造上的不同

各种GPGPU的实现

因为GPU更加适合用来进行大批量特定计算的特性,几大图形软硬件厂商都纷纷推出了自己的GPGPU计算解决方案,主要有以下几种:

ATI Stream

首先提出GPGPU实现的厂商是被收购前的ATI,并专门提供了一套开发工具包(SDK)给程序员以呼叫GPU来参与计算的能力。不过由于各种限制和AMD收购ATI后产生的混乱,这套SDK在与Nvidia CUDA的竞争中处于下风,后来因为AMD官方转向支援OpenCL,这套SDK最终停止了开发。

ATI Stream Logo

Nvidia CUDA

CUDA是Nvidia在G80时代推出的一项技术,全称Compute Unified Device Architechture,统一计算架构。从G80那代核心开始,Nvidia率先采用了一种统一设计的架构,将原本的管线分工式设计转变为统一化的处理器设计。CUDA就伴随着G80核心的释出一起公之于众,这套平台可以让程序员用C和C++来编写用GPU执行的程式,学习成本比ATI Stream要低一些。

Nvidia CUDA Logo

CUDA也是目前应用最为广泛的一种GPGPU实现,在Nvidia的强力推广之下,CUDA在许多领域大放异彩。

OpenCL

上面两个GPGPU的实现都是有平台针对性的,要想用他们的解决方案你就得用他们家的硬件,而OpenCL就不一样了。

OpenCL最早是一组由苹果公司开发出来的用于异构计算的框架,苹果公司将这套框架的草案提交到Khronos组织,作为一种开放标准供业界使用。在2008年末,1.0版本正式公开,目前Intel、AMD与Nvidia的GPU都支援这套框架。

OpenCL Logo

不过OpenCL并不仅限于在x86平台上面提供异构计算的框架,由于跨平台和开放标注的特性,它还可以使用专门的可程式设计电路来加速计算。所以业界对于它的支援非常广泛,下图就是OpenCL联盟成员。

OpenCL联盟

DirectCompute

DirectCompute是微软从DirectX 10开始加入的用于通用计算目的的API集,可以呼叫GPU进行加速计算。从Vista开始,Windows的各种桌面特效就开始采用DirectCompute来加速计算。在DirectX 11中,微软完善了这套API,并且在Windows系统上更多地使用GPU来加速计算系统界面的各种特效。

GPU-Z显示该GPU支援的通用计算特性

具体应用

媒体编码加速

在十年多以前,H.264等面向高清应用的视讯编码格式刚流行起来的时候,因为CPU的效能限制,编码一段H.264的视讯是一件相当耗费时间的事情,所以人们想到了用GPU来加速视讯的编码。Nvidia刚推出CUDA的时候,就将加速视讯编码作为该技术的一大卖点来宣传,并免费提供了一个支援CUDA技术来转码的软件BadaBoom。不过后来,Nvidia在显卡上加入了专门用于视讯编解码的硬件电路,并开放了名为NVENC的编码API供软件呼叫,通用计算也就此离开了这个可以说是最早利用它,也是离我们最近的领域。

BadaBoom加速视讯转码

Adobe也很早就在旗下的CS和CC系列软件中加入了GPGPU的支援,比如Premiere Pro和After Effect都支援OpenCL来加速视讯的实时预览和特效。

视讯补帧与画面优化

在英伟达、英特尔和AMD三家相继在自己的GPU中加入专用计算电路用以加速编解码视讯之后,通用计算就离开了这个领域。但是有些不满足于既有的视讯品质的人们又开发出了新的可以利用GPGPU的功能:视讯补帧。

视讯补帧指的是在原本低帧数的视讯,通过上下帧的计算,渲染出一帧原本不存在的画面补在两帧之间,使其观感更加流畅。比如将24帧的视讯补帧至60帧,因为这个过程的计算量过于庞大,使用CPU跟不上视讯播放的速度,没法做到实时补帧,所以开发者就将这个功能搬到了GPU上来执行,比如很多人都在用的SVP4,就是一个利用GPGPU的补帧软件。

SVP4补帧软件界面

在视讯画面优化领域,目前地球上最强的视讯渲染器MadVR也是利用GPGPU来优化视讯画面表现,比如视讯播放中出现的色带、色环,还有在压制过程中出现的瑕疵等,都可以使用GPGPU在视讯的播放过程中进行实时的弥补。

人工智能与深度学习

人工智能与深度学习是近年来非常热门的两个有关联的领域,训练人工智能需要非常大的资料计算量,这时候就可以利用上GPU的特长,比如热门的深度学习框架TensorFlow就可以使用CUDA来加速学习。

Nvidia在这两年也不断展示了他们在机器学习方面的一些结果,比如在RTX系列上引入的DLSS(深度学习抗锯齿)技术就是利用机器学习来达成的。

DLSS技术

科研领域的应用

科研领域的应用

上图是CUDA在科研领域的一些应用,可以看到GPU确实在很多方面开始默默影响着我们的生活。

超级计算机

老黄从G80开始就一直同步推出同架构的纯计算卡,归于Tesla品牌之下。于是就诞生了很多用Tesla计算卡来组建的超级计算机,比如竞争贝尔·戈登奖的六个入围者中,有五个使用了由NVIDIA GPU提供支援的超级计算机。最近英伟达还联手ARM,在超级计算机领域中继续发力,预计未来采用GPGPU技术的超级计算机将会越来越多。

Tesla V100加速模组

总结

GPGPU这个相对于PC整个历史还算是比较新的概念,经过十余年的发展已经不仅局限于PC,还走向了其他领域,扎根于我们生活的每个角落。GPGPU已经在许多云计算平台上得到了应用,相信在以后,GPU会更加深入我们电子生活的方方面面,在那里默默地发热。

相关文章

最新资讯

  • 全家科技二号店亮相! 自助结账、5G、智贩机登场
    2019-10-22 18:53
  • 【本土文化】80 后女化妆师驾雪糕车手圆梦 蚀本也坚持:太多童年回忆!
    2019-10-22 18:52
  • 双十一的进化与苏宁的场景零售升维
    2019-10-22 17:56
  • 环保和农业再发力 平安科技AI技术中台助力场景…
    2019-10-22 17:53
  • 维修连锁企业用侵权零件修华为手机:涉案金额3…
    2019-10-22 16:53

手机

  • realme 三款高 CP 值新机登场 颈挂耳机、手机壳同步登台
    2019-10-22 16:50
  • Pixel 4被抱怨影片录制仅支援4K、30fps规格 Google表示画质和储存空间更重要
    2019-10-22 09:49
  • 联手 Yahoo / Verizon Media 中华电信宣示发展 5G 影音娱乐内容
    2019-10-22 07:48
  • Pixel 4都不能免费以原图储存在Google相簿上 为什么 iPhone 竟可以免费?Google表示:是Bug
    2019-10-21 16:48
  • HTC推出平价版 EXODUS 1s区块链手机 价格新台币5,990 元
    2019-10-21 15:47

数码

  • 选购大火力灶看热负荷更要看热效率!安利华帝…
    2019-10-22 17:59
  • 最适合父母的洗碗机!操作难倒老年人? 硬核华…
    2019-10-22 17:59
  • 耳边的AI助理,出门问问发布TicPods 2系列头控…
    2019-10-22 18:02
  • 硬核知识科普:色域究竟是什么东西?
    2019-10-22 18:02
  • 一加7T系列首销战况出炉 斩获双料冠军
    2019-10-22 17:00

科技

  • 车好多集团入围2018年度中国十大独角兽排行榜
    2018-07-23 12:33
  • 史前短面熊有多可怕?站立高度近5米 曾称霸整个美洲地区
    2018-07-23 12:33
  • 罕见的活化石生物 能在陆地呼吸的鱼 恐龙见到它也要叫声爷
    2018-07-23 12:33
  • BCH代币化方案讨论大爆发 你的观点是什么?
    2018-07-23 12:33
  • 口碑重塑商业模式侵袭美团主业
    2018-07-23 13:31