报价宝 > 资讯 >

让 AI 自己调整超参数，谷歌大脑新优化器火了，自适应不同任务，83 个任务训练加速比经典 Adam 更快

消息来源:baojiabao.com 作者: 发布时间：2026-05-24

报价宝综合消息让 AI 自己调整超参数，谷歌大脑新优化器火了，自适应不同任务，83 个任务训练加速比经典 Adam 更快

还在苦恼怎么给优化器调整更好的参数吗？

现在，谷歌大脑搞出了一个新的优化器 VeLO，无需手动调整任何超参数，直接用就完事了。

与其他人工设计的如 Adam、AdaGrad 等算法不同，VeLO 完全基于 AI 构造，能够很好地适应各种不同的任务。

当然，效果也更好。论文作者之一 Lucas Beyer 将 VeLO 与其他"重度"调参的优化器进行了对比，性能不相上下：

有网友看到了一丝优化器进步的曙光：

在 Adam 之后出现了不少优化器，却都表现得非常失败。这个优化器或许确实能表现更好。

所以，这个基于 AI 的优化器是如何打造的？

VeLO 究竟是怎么打造的？

在训练神经网络的过程中，优化器（optimizer）是必不可少的一部分。

△ 神经网络训练过程，图源 Thomas Wolf

但 AI 模型应用都这么广泛了，训练 AI 模型用的优化器却仍然是人工设计的，听起来多少有点不合理。

于是谷歌大脑的研究人员灵机一动：为何不用 AI 来做一个优化器呢？

设计上，优化器的原理基于元学习的思路，即从相关任务上学习经验，来帮助学习目标任务。

相比迁移学习，元学习更强调获取元知识，它是一类任务上的通用知识，可以被泛化到更多任务上去。

基于这一思想，VeLO 也会吸收梯度并自动输出参数更新，无需任何超参数调优，并自适应需要优化的各种任务。

架构上，AI 优化器整体由 LSTM（长短期记忆网络）和超网络 MLP（多层感知机）构成。

其中每个 LSTM 负责设置多个 MLP 的参数，各个 LSTM 之间则通过全局上下文信息进行相互协作。

训练上，AI 优化器采用元训练的方式，以参数值和梯度作为输入，输出需要更新的参数。

经过 4000 个 TPU 月（一块 TPU 运行 4000 个月的计算量）的训练，集各种优化任务之所长后，VeLO 终于横空出世。

比人工调参优化器效果更好

结果表明，VeLO 在 83 个任务上的加速效果超过了一系列当前已有的优化器。

其中 y 轴是相比 Adam 加速的倍率，x 轴是任务的比例。

结果显示，VeLO 不仅比无需调整超参数的优化器效果更好，甚至比仔细调整过超参数的一些优化器效果还好：

与"经典老大哥"Adam 相比，VeLO 在所有任务上训练加速都更快，其中 50% 以上的任务比调整学习率的 Adam 快 4 倍以上，14% 以上的任务中，VeLO 学习率甚至快上 16 倍。

而在 6 类学习任务（数据集 + 对应模型）的优化效果上，VeLO 在其中 5 类任务上表现效果都与 Adam 相当甚至更好：

值得一提的是，这次 VeLO 也被部署在 JAX 中，看来谷歌是真的很大力推广这个新框架了。

巴特，也有网友认为耗费 4000 个 TPU 月来训练 VeLO，计算量成本过大：

虽然这个进展很重要，但它甚至都快赶上 GPT-3 的训练量了。

目前 VeLO 已经开源，感兴趣的小伙伴们可以去试试这个新的 AI 优化器。

One More Thing

前段时间，一位哈佛博士生提了个有意思的想法，得到不少人赞同：

更多论文的作者们也应该像演职员表一样，公开自己在论文中的工作内容。

Kareem Carr 是生物统计学领域的博士生，作者贡献在生物论文中比较常见，不过之前在 AI 论文中见得不多。

现在，这篇谷歌大脑论文的作者们也这样做了，谁写的论文、谁搭建的框架一目了然：

不知道以后会不会成为机器学习圈的新风气（手动狗头）。

GitHub 地址：

https://github.com/google/learned_optimization/tree/main/learned_optimization/research/general_lopt

论文地址：

https://arxiv.org/abs/2211.09760

参考链接：

[1]https://twitter.com/jmes_harrison/status/1593422054971174912
[2]https://medium.com/huggingface/from-zero-to-research-an-introduction-to-meta-learning-8e16e677f78a#afeb
[3]https://mp.weixin.qq.com/s/QLzdW6CMkcXWQbGjtOBNwg

本文来自微信公众号：量子位（ID：QbitAI），作者：萧箫

2022-12-21 19:03:20

炒港股要补交多少税？我也接到催交补税特别行动的电话了
2025-07-23 17:36:43
淘宝天猫仅退款属于诈骗吗？淘宝天猫开始部分取消仅退款
2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰
2024-10-01 11:22:38
白嫖党｜山西大同大学学生网购申请“仅退款”被拒骂客服一小时
2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书阿里巴巴竞赛受质疑
2024-06-28 10:07:40
天猫新规可以无条件申请“仅退款”了？淘宝天猫又离狗多多零元购近了一步
2024-06-28 09:27:13
美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
小米汽车传员工3700人雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
国家新闻出版署:认真研究《网络游戏管理办法(草桉徵求意见稿)》关切实行前进一步完善
2023-12-28 19:14:56
印度以打击金融犯罪为由逮捕了两名 vivo 高管
2023-12-26 16:49:01
在国外微信收不到国内信息？微信和WeChat将被拆分
2023-12-15 10:40:15
苹果iPhone15 系列手机发布最新消息预计上市发布时间9月
2023-08-06 23:21:02
华为将发布鸿蒙HarmonyOS4操作系统功能五大升级支持设备清单
2023-08-06 23:17:37
整治自媒体网红账号 400万粉丝网红发布擦边视频被无限期封禁
2023-07-12 09:56:09
网传微信文件传输助手是真人是真的吗?微信官方回应
2023-06-27 15:53:32
电信移动送手机成了“信用购”？你上了运营商的贷款套路了吗？
2023-06-12 17:18:55
中国电信广东地区崩了无信号客服回应已在核实处理
2023-06-08 15:39:04
消息称小米新能源汽车价格表正讨论定价区间：双版本不同配置，高配或超 35 万元
2023-03-06 12:56:03
华为因制裁被传或分拆剥离手机业务? 内部人士回应:可能性不大.
2023-03-05 23:26:41
OPPO正式发布安第斯智能云，让终端更智能
2023-02-24 16:02:27

让 AI 自己调整超参数，谷歌大脑新优化器火了，自适应不同任务，83 个任务训练加速比经典 Adam 更快

VeLO 究竟是怎么打造的？

比人工调参优化器效果更好

One More Thing

品牌选车