脸书AI研究院近期才开源释出自家AR技术的核心物件辨识框架Detectron,近日又打造出轻量版的物件侦测和分割架构MaskRCNN2Go,可在行动装置上即时且准确地侦测人体的动作,MaskRCNN2Go架构是根据脸书自家的物件侦测和分割的架构Mask R-CNN,经过优化和调整后打造出的轻量版本,这套模型现在还在研究阶段。
过去,脸书AI相机团队正在研究多种电脑视觉技术和工具,来协助人们展现自己,举例来说,透过即时的风格转换(Style transfer),能够将使用者的照片或是影片,变成梵高画像的风格,搭配即时脸部追踪器,系统可以帮使用者上妆,甚至将使用者的脸部变成阿凡达,试想,如果能够将整身都变成阿凡达呢?
为了达到这个任务,脸书AI相机团队需要正确地即时侦测和追踪人体的动作,由于要辨识出人的身份和大量的姿势变动,这是非常具有挑战性的问题,人体的动作可能是坐着、走路或是跑步,且侦测的对象穿着也不一,可能穿着很长的大衣或是短裤,再加上,侦测的对象可能被其他人或是物品挡住,这些因素都增加创造准确的人体追踪(Body tracking)系统的困难度。
最近,脸书AI相机团队开发了能够准确侦测人体姿势的新技术,还能区隔人与背景,该套模型只有几MB,能够在智能手机上即时地侦人体,脸书也表示,将来这套模型可以协助创造更多新的应用,像是用手势控制游戏、将人去识别化等。
MaskRCNN2Go的架构
脸书AI相机团队打造的人体侦测和分割模型,是采用了物件侦测和分割架构Mask R-CNN,Mask R-CNN架构是脸书AI研究院先前发表的论文,还获得了2017年度国际电脑视觉大会最佳论文奖,Mask R-CNN可以有效地侦测在图片中的物件,同时预测每个物件外型,建立分割遮罩(Segmentation mask),也就是算法能够侦测图片中每一个物件之后,描绘出每个物件的外型。
为了能够在智能手机上即时执行Mask R-CNN的模型,脸书AI相机团队、AML和FAIR的研究人员和工程师一同合作,创造了一个高效能且轻量型的架构:Mask R-CNN2Go,Mask R-CNN2Go模型涵盖了5个元件,分别是主模型、候选局域网络、人体部位侦测器、躯干侦测器、分割器。
首先,主模型(Trunk model)包含多个卷积层,会产生汇入图片的特征,透过候选局域网络(Region Proposal Network)算法,产生预设大小范围的候选区域(Bounding box),也就是透过图片中的边缘、颜色、纹理等特征,预先找出图片中物件可能出现的位置。
接着,区域特征聚集层(ROI-Align layer)会抽取候选框区域中每个物件的特征,并传送到人体部位侦测器(Detection head)。人体部位侦测器包含一系列的卷积层、池化层(Pooling)和全连接层(Fully-connected layers)。
针对每个候选区域,模型会预测该物件与人的相似度,来判定是物件是否为人体,人体部位侦测器也会用非极大值抑制(Non-max suppression)的方法,修正候选区域的座标位置和相邻的区域,并产生图片中每个人体的最终候选区域。
有了每个人体的候选区域后,研究团队在躯干侦测器(Key point head)中,用另一个区域特征聚集层,萃取图片中人体躯干和头部特征,产生人体躯干的遮罩(Mask),最后,取最大的范围产生最终的座标位置。
为行动装置打造的轻量模型MaskRCNN2Go
原本根据影像辨识架构ResNet打造的Mask R-CNN模型,由于受限于行动装置的运算能力和储存空间,无法在在手机上执行,为了解决这个问题,脸书为行动装置开发了高效能的轻量型架构MaskRCNN2Go。
脸书使用了多个方法降低原模型的大小,花了许多时间在优化并修改多个卷积层的宽度,为了确保有足够大的容纳空间,卷积层的核大小脸书采用1×1、3×3和5×5的大小,也修剪权重来减少模型的大小,最终的模型只有几MB,且非常准确。
为了即时执行深度学习算法,研究团队采用并优化脸书的核心架构Caffe2,善用加速神经网络计算的函式库NNPack、SNPE和 Metal,并将修改过的模型模组化,这样一来可以打造轻量型的模型,又能确保模型可以快速运行,且避免潜在不相容的问题。
脸书表示,开发行动装置的电脑视觉模型是个困难的任务,模型在没有大量的内存条件下,必须占用空间小、运算速度快,预测结果还要准确,脸书未来还会持续开发在行动装置上可执行的高效能模型,来节省所需的电力和运算力。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09