OpenAI以非监督式学习预训练模型,并结合监督式训练做微调,其研究结果显示,人工智能对于语言理解的程度大幅提升,特别在COPA、RACE和ROCStories这三个资料集,被认为需要多语句推理和重要知识参与理解,而OpenAI的新方法比起其他竞争对手,在这些资料集的分数都获得很大程度的提升。
研究团队在进行情绪神经元相关工作时,获得了新方法的启发。这个新方法主要有两个阶段,首先研究团队为非监督式的方法Transformer模型,提供非常大量的训练资料,并将语言建模做为训练讯号,之后在以小型的资料集,对这个模型进行微调,让他适合解决特定任务。
当有足够庞大的资料做为训练输入时,非监督式学习反而可以产生令人惊讶的区别性特征。基于这个发现,当建置模型后,以无监督的方式使用大量资料进行训练,接着对模型进行调校,以提供不同工作的最佳效能,而换句话说,相同的核心模型,透过不同的微调就能处理不一样的任务,大大提升了工作效率。
在近期的机器学习研究中,监督式学习有很大的进展,但是其缺点就是需要庞大、经过仔细整理的标签资料集,而取得这些资料集的成本非常高,Google的人工智能研究团队也提到了同样的困难。因此OpenAI认为,虽然非监督式学习现在可应用的领域仍然非常有限,但可以使用不具有明显人类标记的训练资料,对于研究人员来说极具吸引力,而且由于当前运算资源增加,原始资料的可用性便获得提升。
对于模型以大量文本进行预训练,可以大幅改进自然语言处理的效率,像是Winograd Schema Resolution这类的任务都能得到帮助。研究人员也提到,底层的语言模型也可以不经过训练,便能开始执行任务,他们提到,随着底层语言模型的改进,像面对选择题挑选出正确答案这样的任务,模型性能会在过程中越趋稳定。该模型在COPA、RACE和ROCStories这三个资料集的表现特别良好,无论是在常识推理或是阅读理解上,都超越现存方法的表现。
这个底层的语言模型还能拿来进行情感分析,OpenAI研究人员使用内含正面与负面电影评论的Stanford Sentiment Treebank资料集,让模型预测评论为正面或是负面,在不对这个任务进行最佳化的情况下,推测精确度达80%。这个研究验证了Transformer架构的强健性与稳定性,有足够的灵活性应付各类工作,而且不需要超级参数组设定。当然,比起监督式学习的结果来说,非监督式学习在这部分的研究还在很初期的阶段,但却提供了研究人员另外的可能性。
研究团队也提到了这个方法的3个缺点,首先,这个非监督式学习需要较多的运算资源,过去的研究在NLP任务训练上,仅需要单一GPU就可以完成,但是OpenAI的这个新方法却需要8颗GPU预训练长达一个月,虽然只需要计算一次,但是对于预训练来说成本还是相当高。另外,预训练出来的模型很大,以至于需要更多的计算力与内存进行推测运算。
第二个缺点,从文字学习知识存在限制以及偏差,除了书籍以及网络上的资料提供的知识,可能不完整或是错误外,研究团队引用其他研究,部分特定领域资讯难以透过文字学习。最后,尽管这个方法改进解决多领域任务的效能,但是目前深度学习NLP模型,仍然在很多时候会出现意料之外或是违反直觉的结果,特别是用系统化指标来衡量的时候。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09