
微软的DeBERTa模型在SuperGLUE基准中,超过了人类基准线的89.9分,以90.3分成为SuperGLUE排行榜的第一名。SuperGLUE是2019年,脸书人工智能研究院、Google DeepMind、华盛顿大学和纽约大学共同推出的一系列基准任务,用来衡量现代高效能语言理解人工智能的能力。
DeBERTa是一种变换(Transformer)神经语言模型,使用自我监督式学习技术,以大量原始文字资料进行预训练,与其他预训练语言模型一样,DeBERTa目的在于学习通用语言表达形式,用来解决各种自然语言理解任务。
由于对话式人工智能深度学习模型已发展到一定的程度,过去的基准测试被认为不敷使用。纽约大学、华盛顿大学和DeepMind在2018年的时候,发布通用语言理解评估(GLUE)基准,来评估模型的语言理解程度,但是有不少自然语言处理模型,在GLUE特定任务的表现,已经远远超过人类,但是即便这些模型可以在GLUE超越人类,但是却无法良好处理某些人类可以轻松且完美解决的问题,因此研究人员设计出SuperGLUE,来更好地评估模型能力。
微软提到,SuperGLUE是目前评估NLU模型最具挑战的基准。SuperGLUE共含有8种不同任务,包括选择合理的替代方案(COPA)的因果推理任务,模型必须在取得前提之后,从两个可能的选择判断其因果关系,人类能在COPA任务简单地达到100%精确度,但是人工智能模型则还有许多进步空间。
微软举例,当考虑到前提是“孩子对疾病免疫了”,并且提问“造成这种结果的原因?”,要求模型从“他避免暴露在疾病中”和“他使用了该疾病疫苗”中做选择,通常人类都可以选对,但是这却对人工智能是很大的挑战,因为模型必须要了解前提,才能够正确选择因果关系。
而微软最近透过更大规模地训练DeBERTa模型,使得模型能力获得提升,最新版本的模型拥有15亿个参数48个变换层,光单个DeBERTa模型就能超越人类在SuperGLUE上的表现达到89.9,而组合DeBERTa模型更可达到90.3分,更大幅度超过人类的89.8,另外,DeBERTa模型也在GLUE基准获得90.8分,也是排名第一。
微软将会对外发布这个具有15亿参数的DeBERTa模型以及其程式码,此外,该DeBERTa模型,也会整合到微软图灵自然语言表达模型的下一个版本Turing NLRv4中,支援微软的各种产品。
图灵模型融合了多种微软开发的语言创新技术,并且经过大规模训练,用在Bing、Office、Dynamics和Azure认知服务等产品中,提供诸如聊天机器人、推荐、搜寻以及内容生成等人机互动任务中。
在SuperGLUE超过人类基准的模型,不只有微软的DeBERTa模型,还有Google大脑结合T5与Meena的语言模型,得分为90.2,分数仅差距DeBERTa分数0.1分,另一个分数也很接近人类基准的Google T5模型,也有89.3分。
相关文章
YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作2023-12-27 18:34:43
刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人2023-09-26 21:55:08
WebOS新系统:Palm Pre手机最新款高价登港2023-06-23 15:39:14
帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应2023-06-22 09:36:10
蔚来全系产品降价3万 取消免费换电 换一次电池180元2023-06-12 17:27:49
电商平台三巨头开打最大规模折扣 价格战再次打响2023-03-05 18:58:40
爱立信节省成本裁员四千人 爱立信全球员工总数五分之一2023-02-24 22:27:29
蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭2023-02-23 16:18:14
联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出2023-02-18 12:45:25
蓝色光标2022营收亏损18亿 客户预算减少明显2023-02-18 12:40:08
三星工厂或将80%生产转至越南 因本地劳动力成本上升2023-02-17 23:09:16
香港八达通卡如何激活?没用失效过期余额怎么办2023-02-17 18:34:51
中兴通讯被曝将裁员20% 称只裁国外的2023-02-17 18:33:26
苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出2023-02-17 16:57:22
突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌2023-02-16 14:31:19
三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?2023-02-14 00:53:17
Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要2023-02-14 00:32:08
谷歌google计划重返进入中国市场?但结果可能令你失望2023-02-13 16:57:15
Zoom紧急裁员1300人 佔员工总数15%2023-02-08 14:59:11
最新资讯
炒港股要补交多少税?我也接到催交补税特别行动的电话了2025-07-23 17:36:43
淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
手机
中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15