APP下载

微软运用AI精准标记出软件重大安全性臭虫

消息来源:baojiabao.com 作者: 发布时间:2024-05-13

报价宝综合消息微软运用AI精准标记出软件重大安全性臭虫

微软发表了一个人工智能系统,可用少量的资讯精准分类臭虫,该系统能够以99%精确度区分安全性和非安全性软件臭虫,并以97%精确度辨识出高优先度安全性错误,且还能够容忍资料存在噪声。这个系统已经发表成论文,微软提到,接下来他们会在GitHub上开源该系统,并提供范例模型以及相关资源。

应用程序总是存在不少臭虫,因此开发人员需要筛选这些待处理的功能以及错误修正,优先处理紧急的项目,虽然这些过程有一些自动化工具帮助,但是微软提到,工程师还是经常浪费时间在处理误报的臭虫回报上,反而遗漏真正重要的安全漏洞。

微软总共有4.7万名开发人员,当在正进行的专案有100多个,每个月会产生将近3万多个错误,为了更精准地解决重要的臭虫,省下浪费的时间,微软要用机器学习技术,提升辨识与分类安全漏洞的能力。从2001年来,微软已经收集了1,300万个工作项目以及臭虫,这些资料可被用来训练机器学习模型,辨识与分类臭虫。

过去也有类似的研究,利用机器学习来辨识安全漏洞,但都是基于所有臭虫报告资讯,即使能用于机器学习模型训练和评分工作的假设上,但是这样的假设无疑与现实情况不符,在部分情况下,并不会有完整的臭虫报告可以使用,像是错误报告可能包含密码、个人身份资讯或是其他敏感资料,微软提到,他们研究的其中一个重点,是希望可以使用较少的资讯,就能良好地辨识安全性臭虫。

另外,臭虫储存库中的条目,通常存在标签错误的情况,安全性问题被归类在非安全性问题中,而非安全性问题也可能被标记为安全性问题,原因很多,可能是开发团队缺乏资讯安全专业知识,或是问题有其模糊的地方,可能该非安全性错误没有直接的安全性问题,但在间接操作下,可能存在安全隐忧。

标签错误还衍生出了一个严重的问题,资安专家必须要耗费时间手动检查错误资料,这个过程花费的成本很大,因此微软提到,在实作自动分类功能上,他们必须要解决用在机器学习模型的资料集,存在噪声的这个问题,除了要了解噪声影响分类器的情况,也要让模型即便在资料集被噪声污染下,仍可以强健地运作。

微软利用了许多安全性与非安全性错误的资料集来训练模型,让模型可对未预先分类的臭虫回报进行分类,这些资料由安全专家审查,确保训练资料的品质。这个机器学习模型具有两个步骤,第一个步骤,模型会分类出安全性与非安全性错误,第二步则是对安全性漏洞进行关键、重要和低影响排名。

微软在这个研究中,证明了即便只利用臭虫报告的标题资讯,也能够精确地辨识安全性错误报告,微软提到,还没有类似的研究存在,过去的研究都需要使用完整的臭虫报告,这对于具隐私资讯的臭虫回报特别有用。微软这个臭虫分类模型能以99%的精确度,正确分类安全性漏洞与非安全性漏洞,并且能以97%的精确度,将安全性臭虫辨识为重大与非重大安全性问题。

2020-04-19 16:47:00

相关文章