图/取自神盾官网
随着AI走向边缘运算,越来越多人投入AI推论芯片的研发,目的要即时分析终端装置接收到的资讯,来减少资料上云可能造成的延迟。然而,终端装置搜集到类比讯号后,需要透过类比数位转换器(ADC,Analog-to-Digital Converter),以0与1的形式存成数位资讯,再来执行AI运算,换句话说,若要做到即时的资料分析,更直观的做法,是在接收到类比资讯的同时就进行运算,不但能省下类比转数位的时间,也能省下芯片内建ADC元件的成本。
然而,这么做可能吗?在台湾,有一家公司投入类比AI芯片的研发,已经将研究成果初步运用在自家指纹辨识芯片中,正是全世界指纹辨识芯片出货量第二的神盾。神盾首席运营官林功艺表示,目前全球在研发类比AI芯片的厂商非常少,IBM是其中一家,在去年4月推出了一款类比AI芯片,运用相变内存(Phase-change memory,PCM)来打造内存内运算架构,来执行类比资料的AI运算;此外,也有一家美国研发AI芯片的公司Mythic,从去年开始投入类比AI运算芯片的研究,试图将这款芯片应用在云端运算中,“神盾采用的技术与Mythic相似,但聚焦在边缘运算。”
在近期一场活动上,林功艺也揭露类比AI运算的优势与应用。现在的电脑架构,是70年前定下的范纽曼型架构(Von Neumann architecture),把内存跟运算(CPU)分开,中间用总线(Bus)传输资料。然而,将CPU与内存分开的架构,对于运算量动辄几亿次的AI运算中,光是在内存与CPU之间搬运资料的过程,就会产生严重的功耗;且因资料传输带宽(Memory Bandwidth)的局限,资料搬运速度往往比不上CPU执行AI平行运算的速度,导致CPU部分乘加器(MAC)闲置,运算资源无法利被完全利用。
林功艺表示,如果用类比资料来做AI运算,是直接在终端分析即时且连续的类比资料,由于不需要转存成数位资讯到内存,也就能省去内存与CPU之间资料传输的庞大功耗,因此,在类比AI芯片的架构上,需要的晶体管(transistors)数量会少很多。举例来说,要执行8位元的平行化运算,若用数位资料做乘法运算,需要约3000个晶体管,做加法运算,需要300个晶体管;然而,用类比资料来做乘加运算,总共只需30个晶体管,功耗大约为原先执行数位运算的1%。
“类比跟数位在图形理论、类神经网络架构、数学基础一模一样,唯一不同的是我用类比的方式做乘加器,只要1%的晶体管。”换句话说,在能得到相同AI辨识结果的情况下,类比AI运算消耗的功耗更少,对于现有硬件架构来说是一种很大的突破。
林功艺引述IBM研究院AI硬件中心一份研究,来说明未来几年执行浮点运算硬件效能(Giga FLOPS/Watt)的局限,从图中可以看见,若现有深度运算的技术并无革命性的发展,数位AI运算效能将在2021年达到巅峰,而类比AI运算还能继续突破运算限制,可能成为未来的发展趋势。
若现有深度运算的技术并无革命性的发展,数位AI运算效能将在2021年达到巅峰。
应用类型一:结合摄录影机进行影像辨识,来降低资料储存、传输的内存与带宽
由于储存到云端的资料都已经数字化,因此,类比AI芯片更适用于边缘运算。林功艺也表示,神盾主要是做手机上各式各样的感应器(Sensor),“我们的好处在于,是站在sensor前端,本质上非常类比的IC设计公司。”也因此,将类比AI芯片与各式终端感应器结合,就是神盾要开发的市场。
林功艺也以摄录影机结合影像辨识功能,来说明类比运算AI芯片的应用方式。当镜头接收到的类比影像后,不同于一般边缘运算,是把类比转数位之后再进行影像辨识,运算过程会产生庞大功耗;类比AI运算是在感应器不断接收到类比资料时,就直接影像辨识并撷取其特征值,压缩存成数位资讯再后送云端,最后,以生成对抗网络(GAN)在云端重建影像。
比如说,将类比AI芯片与监控摄影机结合,只有在镜头侦测到有机车、行人、猫狗经过,或任何风吹草动使画面转变时,才会开始撷取特征值、后送云端重建资料,换句话说,其他没有动静的画面就无储存纪录。如此一来,就能大幅降低资料储存、传输的成本。尤其中国的监控摄影机,直到2019年设置将近2亿支,在晚上8小时且无人车行经的场域,还是必须不断的摄录影并储存,更别提往后要传输到云端或搜寻资料,都会花费很多成本去执行。
也就是说,用类比运算进行AI分析,不仅可以达到侦测异常画面来报警的目的,更能减少大量数位资料储存、传输上云所耗费的带宽与内存空间。根据史丹佛大学Meltem & Ahmad的研究,若一张未压缩的人脸图像资料大小有26,966 bytes,尽管压缩后只剩478 bytes,仍然可以用生成对抗网络还原成几乎相同的图像。林功艺以此说明,以压缩后的影像与特征值,来重建原始影像的可行性。
史丹佛大学学者Meltem & Ahmad用生成对抗网络,可将478位元的资料还原成足够清楚的人脸影像。
对此,林功艺也表示,无论用类比或数位资料进行AI分析,撷取特征值并压缩影像后,都会有些微失真,但以GAN重建过后,并不会有哪张影像比较精准的问题,因为使用的算法一样,而类比运算的优势,是在于更低的运算功耗与芯片成本。
此外,除了结合监控录影机,类比AI结合影像辨识的应用还很多。例如,侦测一间教室的人数来决定冷气温度,或是人造卫星拍摄的卫星影像,尤其人造卫星数量从1960年代至今已经将近5,000个,一天24小时中,还必需不间断拍摄高分辨率的影像并回传到地面,每日储存传输的资料量非常庞大,这都是类比AI技术有潜力的市场。
应用类型二:结合自驾车进行影像辨识,来降低有线传输造成的判读延迟
另一个可行的应用,则是自驾车针对路况影像来即时辨识。相较于摄录影机影像辨识的应用,着重在降低资料储存、传输所占用的内存与带宽,自驾车的应用,则是要强调能更快速的对路况做出反应,来减少几百毫秒的延迟。
现今的先进驾驶辅助系统(Advanced Driver Assistance Systems,ADAS),在进行影像辨识的过程,是先透过感应器接收类比资料,并透过ADC转换为数字信号,接着由SerDes(序列器)将多路低速并行信号转换成高速串列信号,通过LVDS高速传输后,再透过SerDes(解除序列器)转换回多路并行讯号,经过数字信号处理(Digital signal processing)来优化讯号,最后进行影像分析。
然而,对比ADAS以有线传输的方式来进行数位AI影像分析,若以边缘运算来进行影像辨识,以上资料传输的过程,都可以用一个内建于感应器的影像辨识芯片来取代,来即时的分析影像资讯并将结果回传。在边缘运算中,同样的,数位AI芯片也能做,但用类比AI芯片,功耗会更低、也更便宜。
第一列,是现今ADAS架构中,将数位资讯回传至后端运算所需经过的转换;第二列,则是直接使用内建于感应器中的类比AI芯片执行边缘运算。
为什么边缘运算会更快?除了省去一长串资料传输过程所造成的延迟,也因为现今车子串流影像的传输限制为30 fps(每秒30影格),在录影机侦测路况时,至少需要一帧的影像画面,才能辨识出物体样态,而物体动作的侦测又更久,尤其是横向移动的轨迹侦测,究竟该物件是在靠近车子还是远离车子?最少需要十影格的时间,才足够自驾车对路况做出判断。这时,因有线传输的限制是每秒30影格,10影格换算之后也就是0.333秒。换句话说,车子需要0.333秒的反应时间,才能决定要减速还是闪避。
以去年3月Uber自驾车撞死横越马路的行人车祸为例。当时,一位妇人牵脚踏车横向穿越马路,而Uber以55km/hr的速度前进,0.333秒换算之后约为5米的距离,也就是说,车子辨识到物体后还会继续前行5米才做出反应,这还不包括中间类比转数位、以及传输的时间,等到车子反应过来,也许已经闪避不及。
若以类比AI芯片结合边缘运算,使用60、120甚至240fps的摄影机来捕捉画面,以现在手机的摄影功能就做得到,同样以10影格来辨识物体移动路径,能更即时的对路况做出反应,在分秒必争的驾驶场景中,无疑更有优势。
应用类型三:结合智慧音箱进行语音辨识,来降低24小时辨识的耗电量
除了影像辨识的应用,林功艺也举出一个语音辨识的案例,比如现在很流行的语音助理,当用户喊出“Alexa”、“OK, Google”、“Hey, Siri”等呼叫的起手式,就能启动语音助理的功能。“但大部分的人都不知道,他整天24小时都再听你讲话,听到Alexa才开始,平常不听怎么醒过来?”
若以数位资讯来语音辨识,辨识前经过的流程,从一句话被麦克风接收,透过ADC转成数位资讯,接着用DSP优化资讯,最后进行语音辨识,由于每个元件要发挥作用时都需要耗电,换句话说,语音助理必须维持有电的状况,才能在辨识Alexa的时候即时启动。这时,用类比运算来做语音辨识,只要消耗一点点的电能,一样能唤醒语音助理,“他不用有ADC、DSP,类比AI功耗小,耗电量就变很少。”
林功艺表示,神盾的强项是将AI芯片与感测器结合,如温度计、麦克风、摄影机等,尽管现在除了自家指纹辨识芯片之外,尚未与其他硬件厂商合作推出应用,但近来越来越多车厂有意与神盾合作,未来可能从自驾车或车联网的应用开始发展。此外,神盾也参与了工研院AI on chip的计划,自己开发AI类比运算的技术,并由工研院协助研发编译器(compiler),提供客户编译器来训练AI模型,加速应用的落地。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09