APP下载

AI重新定义边缘计算的重要性

消息来源:baojiabao.com 作者: 发布时间:2024-05-09

报价宝综合消息AI重新定义边缘计算的重要性

来源:新图智

在广义上,计算的历史是对理想系统架构的不断搜寻。在过去的几十年中,系统架构师不断地从集中式配置中来回移动,其中计算资源位于远离使用者的分散式体系结构中,其中处理资源更靠近个人使用者。

早期的系统使用高度集中式的模型来向遍布企业的使用者提供增加的计算能力和储存能力。在20世纪80年代和90年代,这些集中式架构让位给低成本PC的兴起和LAN的出现,然后因特网连线起来。在这个新的模型中,计算任务越来越多地委托给个人PC。

随着膝上型电脑、平板电脑和智能手机的兴起,这种高度分散式的架构最终演变成了移动性。但是随着计算需求的增加,系统架构师开始将任务移动到云,在那里他们可以利用其几乎无限的计算和储存资源,高可靠性和低成本。因此,近年来,组织开始转向围绕云构建的更加集中的方法。例如,智能手机把所有的东西都送回云中进行处理和储存。当需要资料时,然后将其返回到装置。

因此,云是当今企业进行高阶计算和分析的地方。公司使用云来执行像Oracle那样的企业级应用程序,然后使用PC来解释和分析结果。随着企业采用机器学习技术并采用更高水平的人工智能,云端计算资源可能会在每个组织中扮演越来越重要的角色。今天,云端计算提供了强大的优势。它允许组织简化资本支出,并管理与IT基础设施相关的运营和维护成本。每个智慧工厂都需要这些资源来管理多个机器视觉系统,每个智慧城市都需要云来协调管理交通模式的交通灯,并优化数千个路灯的功率效率。

边缘的人工智能

然而,并非所有的应用程序都会从云中执行。事实上,随着设计师向边缘执行的应用程序增加越来越高的智慧水平,他们将需要更快速地响应不断变化的环境条件。例如,当一辆自主车进入一个智慧城市时,它就迫不及待地与云沟通,以确定交通灯是红色时是否停车。它必须立即采取行动。类似地,当智慧家居中的安全系统检测到房屋内的移动时,它必须依靠其装置上的资源来检测该移动是否是闯入房屋的窃贼或只是家庭狗。

这需要独立和快速地做出决定,将定义一类新的边缘智慧装置。使用诸如语音或面部识别等技术,这些新装置将能够在环境变化的情况下定制它们的功能。并且,通过应用机器学习和人工智能技术,这些装置将能够基于不断收集的资料来学习和改变它们的操作。

但是,它们如何与云工作,将大大不同于专门使用云来处理和储存的智慧系统。机器学习通常涉及两种型别的计算工作负载。在训练中,系统从现有资料中学习新的能力。例如,系统通过收集和分析数以千计的人脸影象来学习面部识别能力。因此,训练是计算密集型的,并且需要能够处理大量资料的硬件。第二种型别的工作量,推断,通过识别模式和执行任务,将系统的能力应用到新的资料。这允许系统随着时间的推移学习并增加他们的智慧,他们执行的时间越长。在边缘上执行的系统不可能在云上进行推理。相反,他们需要利用车载计算资源来不断扩充套件他们的智慧。

这个市场机会的范围很难夸大。潜在的应用范围从消费者应用,如智慧电视,可以感觉到当用户离开房间并自动关机,下一代机器视觉解决方案的目标是在未来的智慧工厂。显然,边缘计算解决方案最热门的市场之一是汽车行业。汽车从一个主要机械装置迅速发展到一个日益电子化的平台,推动了这一转变。这一过程始于娱乐系统从无线电和磁带平台向高度复杂的资讯娱乐系统的快速演变。它一直伴随着先进的驾驶员辅助系统(ADAS)的出现,旨在提高安全性。例如,研究和市场公司的分析师现在预测,ADAS市场将在2016和2021年间以10.44%的复合年增长率增长。

移动市场的最新进展有助于加速这种变化。智能手机为汽车带来了新的功能和应用,移动处理器和标准化的MIPI界面的发展有助于降低将这些能力整合到汽车中的成本。如今,先进的汽车娱乐系统提供资讯和娱乐,而ADAS解决方案带来了广泛的安全功能,包括自动制动、车道检测、盲点检测和自动平行停车功能。

为了使这成为可能,今天的汽车将越来越多的视觉系统整合到汽车内,以监控汽车内部的驾驶员以及道路状况。这些嵌入式视觉系统跟踪驾驶员的头部和身体移动以指示困倦或分心,以及扩大的外部摄像机数量以支援自动停车和倒车辅助、盲点检测、交通标志监视和避碰。车道偏离预警系统等新的应用将视讯输入与车道检测算法相结合,以确定车辆在道路上的位置。因此,汽车制造商正在整合每辆车的许多摄像头。为了建立这些新的ADAS能力,设计者预期他们将需要面向前方的摄像机,用于紧急制动、车道检测、行人检测和交通标志识别以及侧向和后向摄像机,以支援盲点检测、泊车辅助和交叉交通警报F。法令。

在制造这些系统时,汽车制造商面临的一个限制是有限的I/O。通常,处理器今天具有两个相机界面。然而,许多ADAS系统需要多达八个相机以满足影象质量要求。理想情况下,设计者可以使用一种解决方案,使它们能够协同处理来自多个摄像机的多个视讯流,或者在将资料传递给应用程序PRO之前对摄像机输入执行各种影象处理功能。

上面的框图描述了一个开发者如何使用一个ECP5 FPGA来生成一个鸟瞰子系统(见下文),之前使用多ARM处理器来实现。

历史上,设计者使用单个处理器来驱动每个显示器。现在设计者可以使用单个FPGA来替换多个处理器,聚集来自每个相机的所有传入资料,将影象拼接在一起,执行前处理和后处理,并将影象传送到系统处理器,如下所示:

一个典型的鸟瞰图从多个相机的资料聚集。

这些新的视觉和感测器能力为自主汽车的引入奠定了基础。例如,凯迪拉克今年将推出超级巡航,这是业界第一个扩音驾驶应用之一。这种新技术承诺通过连续地分析驾驶员和道路,使驾驶员更安全,而精密镭射雷达数据库提供道路细节和先进的摄像机、感测器和GPS实时地对动态道路状况作出反应。

智慧工厂

在工业领域,AI和边缘应用有望在智慧工厂的发展中发挥越来越重要的作用。在2011率先提出的工业4模式的推动下,下一代智慧工厂将将先进的机器人技术、机器学习技术应用于软件服务和工业物联网(IIOT),以提高组织和最大化生产率。

虽然工业1标志着将水和蒸汽动力机械引入制造业,但工业2反映了由制造商的计算机和自动化整合定义的电力大规模生产技术的运动。即将到来的工业4模型将引入网络物理系统制造,以监控智慧工厂中的物理过程,并利用人工智能资源进行分散决策。通过引入诸如大资料和分析的元件、IT和IOT的融合、机器人技术的最新进展和数字供应链的演进,这一演进将推动该行业的数字化转型。此外,通过不断地与人类和操作员进行通讯,这些物理系统将成为IIOT的一部分。

智慧工业4工厂如何与当前工厂不同?它将提供几乎通用的互操作性和更高级别的机器、装置、感测器和人之间的通讯。其次,它将高度重视资讯透明,其中系统通过感测器资料向上下文化的资讯建立物理世界的虚拟副本。此外,智慧工厂的决策将高度分散,允许网络物理系统尽可能自主地执行。最后,该工厂的新发展将具有高水平的技术援助,其中系统将能够帮助彼此解决问题、做出决定并帮助人类完成可能是高度困难或危险的任务。

不同需要

设计师需要把这些新的人工智能能力带到什么边缘?传统上,在资料中心采用深度学习技术的设计者严重依赖高效能GPU以满足苛刻的计算需求。设计师把AI推向边缘并没有那么奢侈。他们需要计算效率高的系统,可以满足精确的目标,同时符合严格的功率和足迹限制,通常发现在消费市场。

无论开发人员正在为智慧家居构建安全系统、智慧城市的自动化照明系统、为下一代汽车提供自主驾驶解决方案或为智慧工厂提供智慧视觉系统,它们都需要能够处理高清的价效比高的计算引擎。实时数字视讯流。他们还需要高容量固态储存,智慧相机或感测器和先进的分析算法。

通常,这些系统中的处理器必须执行从影象采集和透镜校正到影象处理和分割的各种任务。在一些应用中,设计者可以使用各种各样的处理器型别,从微控制器、图形处理单元(GPU)和数字讯号处理器(DSP)到现场可程式设计门阵列(FPGA)和特定于应用程序的标准处理器(ASSP)以满足这些要求。每个处理器体系结构都有其独特的优点和缺点。在某些情况下,设计者将多个处理器型别组合成异构计算环境。在其他情况下,它们可以将多个处理器型别整合到单个装置中。

需求越来越多的解决方案,利用应用程序支援和制造规模与移动处理器和MIPI相容的感测器和显示器,并采用人工智能,机器学习和神经网络,使智慧的边缘。神经网络在机器学习中的应用,如影象识别,可能需要兆字节的资料和计算能力的外显子来开发资料结构并分配权重。因此,对于这些应用程序的机器学习通常在资料中心发生并不奇怪。

一旦模型被训练并移植到嵌入式系统,装置就必须更快更有效地做出决策。在大多数情况下,设计者需要一种将计算效率与低功率和小足迹结合起来的解决方案。

业界普遍认可机器学习需要高度专业化的硬件加速。但是根据任务的不同,需求是很大的。例如,用于训练应用的硬件设计者专注于使用32位浮点运算的高精确度的高水平计算。在网络边缘,执行推理的设计者更倾向于牺牲精度,以提高处理速度或降低功耗。在某些情况下,使用定点计算的应用可以在消耗更少功率的情况下向浮点应用提供几乎相同的推理精度。

在这种情况下,使用ECP5 FPGA实现卷积神经网络(美国有线电视新闻网)加速器在边缘上的面部识别应用。

在某些情况下,支援这种型别的设计灵活性的处理器在这些型别的应用中提供了明显的优点。例如,FPGAs将广泛的嵌入式DSP资源和高度并行的架构结合起来,在功率、足迹和成本方面具有竞争优势。点阵半导体的ECP5 FPGA中的DSP块可以使用浮点数学来计算比GPU更少的功率/ MHz的定点数学。

同时,神经网络的产业研究也在不断推进。最近,格子半导体与高效能软核处理器的开发人员合作,为嵌入式应用开发基于神经网络的推理解决方案,用于面部检测应用。解决方案是在小于5000的LUTS的ICE405K FPGA。使用开源的RISC-V处理器与定制加速器,这种设定大大降低了功耗,同时缩短了响应时间。

结论

边缘计算给基于人工智能的系统的开发者带来了下一个巨大的挑战。随着设计师增加更高层次的智慧,需求将增长的解决方案,可以更快速和准确地响应不断变化的环境条件。寻找开发人员采用广泛的技术来满足这一新的需求。

2019-07-12 14:51:00

相关文章