APP下载

Google第二代行动装置版电脑视觉神经网络模型出炉!让手机执行影像辨识更快更准

消息来源:baojiabao.com 作者: 发布时间:2024-04-23

报价宝综合消息Google第二代行动装置版电脑视觉神经网络模型出炉!让手机执行影像辨识更快更准

Google在去年6月推出行动装置版的电脑视觉神经网络模型MobileNetV1,近日则在官方部落格中宣布推出第二代MobileNetV2,改善了分类、物件侦测和语义分割(Semantic Segmentation)技术,不论是速度和准确率都有所提升,已于今年1月发表MobileNetV2的论文,Google相信MobileNetV2将会对许多视觉辨识任务有帮助。

MobileNetV2是以第一代为基础来改善,延续了第一代透过深度可分离卷积(Depthwise Separable Convolution)的方式,来达到压缩模型的目的,减少参数并提升运算速度,不过,第二代还新增了2项特性,层间的线性转换方式(Linear bottleneck),以及Bottleneck之间的捷径连接(Shortcut connections)。

第二代在深度可分离卷积方法前,增加了1X1的扩张层,来增加Channel数量,进而制造更多特征,最后输出时则不用线性整流单元(Rectified Linear Unit,ReLU)函数,为了避免特征被破坏,改采用线性转换的方式。

另一个特性则是,MobileNetV2与传统的ResNet不同,ResNet是先压缩维度,透过卷积萃取特征,最后再扩张,而MobileNetV2则是相反的结构(Inverted residuals),先扩张,萃取特征,最后再压缩,因此,捷径连接的是维度缩减后的结果。

MobileNetV2模型的结构图,图片来源:Google。

Google表示,MobileNetV2相比第一代的模型,在同样的准确率下,执行的速度更快,尤其是,在Google Pixel手机上测试,新的模型所需的操作减少了2倍,所需的参数也少了30%,提升了大约30~40%的速率,准确度也有提升。

2018-04-06 12:31:00

相关文章