为了打击在Android中的潜在有害应用程序(Potentially Harmful Applications,PHAs),Google使用全面性的Android安全服务Google Play Protect,合并应用监督式和非监督式机器学习技术,以精确检测并且分类PHA。
检测PHA是一项工程浩大的工作,需要投入大量的资源,Google需要了解应用程序与使用者互动的过程,分析复噪声号以了解PHA的行为。为了可以快速且大规模的侦测PHA,Google利用机器学习,让系统在不需要人为介入的情况下就能自动搜寻PHA,而且只要透过增加运算能力,就能增加分析的规模。Google提到,机器学习比起人可以更有效的从资料中,找到讯号之间隐藏的关联。
Google Play Protect机器学习保护主要由两个部分构成,分别是资料以及和机器学习模型,而资料来源又分为应用程序的资料,以及使用应用程序的体验资料。首先,应用程序的资料来自Google Play Protect分析网络上找到的所有应用程序。透过拆解应用程序的APK,并且深入分析提取PHA讯号来创建资料集,这些资料除了特定特征外,还包含像是SMS诈欺、网络钓鱼或是权限提升等行为。
Google Play Protect会对APK档案中的各种资源,进行静态和动态分析,这两种方法相辅相成,Google表示,只要程式码经过混淆技术,就会阻碍静态分析,但是动态分析透过执行应用程序,因此一样能找出问题所在,而静态分析则能检测在实作中可以绕过动态分析,试图隐藏在程式码的恶意部分。综合动态与静态分析,产生应用程序特征资讯,作为机器学习的资料来源之一。
除了应用程序的资料,机器学习的资料还需要使用者使用应用程序的体验资料,这些资料来自Google Play的使用者回馈,包括安装、卸载、用户评分和评论的数量等资讯,另外,有关开发人员的资讯,像是使用的凭证以及发布应用程序的历史纪录,也都是可用来辨识PHA的资讯。应用程序的体验资料,由每天开发人员提交的应用程序,以及数百万Google Play使用者产生,能帮助Google了解应用程序的品质、行为和目的,以辨识新的PHA行为。
通常这些资料来源提供的都是原始讯号,需要经过转换才能给机器学习使用,虽然部分原始讯号具有明确语意意义能直接被利用,但是大多数情况,需要重新设计资料以找出更强而有力的特征。像是汇总特定开发人员拥有所有的应用程序评分,个别对每位开发人员进行评分,用来验证未来的应用程序。也会使用嵌入技术,为稀疏资料创建压缩表示,或是为了简化资料使其更容易被模型使用,以特征选择技术,根据目标不同保留最相关的讯号,并移除不相关的讯号。
Google提到,机器学习模型设计对于有效且精准的侦测PHA很重要,但是要辨识特定类型像是SMS诈欺或网络钓鱼等PHA行为并不容易,这些行为都只是广义的名词,实际上符合定义的可能包含了广泛的样本。抑或是,同一个PHA活动,是由一群应用程序构成,这些应用程序共享部分程式码和行为。
为了应付复杂的PHA行为,Google使用多种建模技术以修正使用的机器学习方法,包括监督式与非监督式的方法。Google使用监督式逻辑回归来侦测大部分的PHA,逻辑回归模型结构简单可以快速训练,可用来分析不同PHA和应用程序特征的重要性,进而改变特征工程程序。经过几轮的训练、评估和改进之后,便能产生生产用的最佳模型。
而针对其他更为复杂的PHA案例,Google使用深度学习,以捕捉不同PHA特征间复杂的互动,并找出隐藏的关联。由于 Google Play中存在数百万个应用程序,提供了丰富的资料集,很适合用于训练深度学习模型,而且除了目标特征工程外,由于深度神经网络有拥有许多层,每层具有多神经元,可以用来处理讯号,Google透过改变层数以及每层的神经元,来改变模型行为。此外,Google还使用了非监督式的机器学习方法,因为许多PHA使用相同技术,非监督式方法可以用来定义行为相似的应用程序群集,而这能更加有效识别并减轻PHA的威胁。
但Google也提到,PHA不断发展,所以他们的模型也需要不端的更新,而且训练资料也要使用近期的应用程序资料,才能维持相关性,透过维护机器学习模型的建立和更新循环,才能确保系统侦测的精确度。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09