Google对外开源了用于自然语言预训练的新技术BERT(Bidirectional Encoder Representations from Transformers),让使用者可以在云端TPU或是GPU上,快速地训练问答系统以及其他类型的模型。这个BERT版本建构在TensorFlow之上,专案除了有源代码之外,也包含了许多预先训练的语言表示模型。
自然语言处理面临的挑战之一便是缺乏训练资料,Google提到,由于自然语言训练是一个综合许多不同任务的多样化领域,而大多数任务特定资料集就仅包含数千或是数十万标签训练范例,但是基于现代深度学习技术的自然语言,资料集的规模需要达数百万或是数十亿的标签训练资料范例,才能获得真正良好的结果。
但事实上,要取得这么大量的训练资料并不容易,因此才发展出了预训练技术,来缩小需求与实际资料量的空缺差距。预训练使用网络上大量未标记的文字来训练通用语言表示模型,而预训练的模型可以接着使用情感分析或是问答等小型特定资料集,进行预训练模型微调,这样的方法比一开始就使用这些特定领域的资料集进行训练,可以明显提升模型准确度。
预训练分为上下文(Contextual)或无上下文,其中上下文又可进一步分为单向或双向的。像是word2vec或GloVe等无上下文模型,为每个字汇产生单词嵌入表示,Google举例,“银行”这个词对“账户”和“河岸”,具有相同的无上下文表示,而上下文模型所产生的单词表示将会基于句子中的其他词,以“我存取银行账户”句子来说,单向的上下文模型,以基于“我存取过”而非“账户”来表示“银行”。
BERT采用预训练上下文表示方法,其中也包括使用了半监督式序列学习、生成式预训练、ELMo和ULMFit技术,不像过去其他模型,BERT是第一个深度双向、无监督的语言表示,仅使用纯文字资料数据库进行预训练。以上面提到的例子来说,BERT双向上下文模型,则会以句子中单词前后的文字,包括“我存取过”和“账户”来表示“银行”。Google从深度神经网络的最底层开始,使其具有双向特性。
双向上下文模型非常强大,但之前之所以没有系统使用双向模型,是因为其训练并不简单,单向模型只要预测单次在句子中的前一个单词,就能进行有效的训练,但光只是每个单词的前一个或是下一个单词这样的简易条件,是无法训练出双向模型的,因为这将让该单词在多层模型中,间接的把自己列入参考。Google采用直觉的方法,以遮罩盖住一些输入的词,并对每个词双向地预测遮盖的词。虽然这个方法已经存在很久了,但是BERT是第一个成功将其实作于训练深度神经网络的技术。
Google为了测试BERT的效能,与其他先进的自然语言处理系统相比。BERT几乎不需要针对特定任务进行神经网络基础架构调整,就能实现所有的结果。在史丹佛问答资料集SQuAD v1.1,BERT获得新高分,精准度达93.2%,超过之前最高分的91.6%和人类分数91.2%。
而Google开源的BERT的预训练新技术,使用者可以在云端TPU以约30分钟,或是使用单个GPU花费数小时,就能训练出先进的问答系统。Google提到,由于云端TPU的技术,让他们可以更快速的进行实验以及调整模型,而这对于超越现有的预训练技术至关重要。
Google这次开源的专案,包含了建构在TensorFlow上的程式码以及其他的语言表示模型,除了让自然语言处理研究人员不需要重头开始撰写程式码外,其中包含的模型,可以让使用者以数小时或是更短的时间内,对各种自然语言任务进行微调。不过,目前发布的BERT模型仅限英语,在将来还会发布多种语言预训练模型。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09