40美元18分钟训练整个ImageNet 他们说 这个成绩人人可实现
消息来源:baojiabao.com 作者: 发布时间:2026-05-10

夏乙 发自 麦蒿寺
量子位 出品 | 公众号 QbitAI
腾讯前不久创造了机器学习训练新记录:在ImageNet上训练好AlexNet,只要4分钟。
震惊声钦佩声一片。同时,也有更多人的目光,落在了这项研究背后的庞大计算力之上:
4分钟在ImageNet上把AlexNet训练到58.7%的准确率,用了1024块英伟达Tesla P40 GPU;6.6分钟把ResNet-50训练到准确率75.8%,用了2048块P40。
按5万元一块保守计算,这项研究仅GPU成本就超过了1亿元。就算不去考虑机房机箱CPU等等其他成本,也已经不是贫民普通实验室能玩得起的了。
偏有贫穷团队不信邪。
在线深度学习课程fast.ai的创始人Jeremy Howard和自己的学生Andrew Shaw、以及国防创新部门DIU的Yaroslav Bulatov一起,用租来的亚马逊AWS的云计算资源,18分钟在ImageNet上将图像分类模型训练到了93%的准确率。
于是,Howard在fast.ai官方博客上发布了一篇文章:现在,任何人都能18分钟训练完ImageNet啦!
他说,在人人能用的硬件(公共基础设施)上把ImageNet训练到这样的准确率,这个速度是个新记录,比Google用TPU Pod在斯坦福DAWNBench测试上达到的速度还要快40%。
这样的成绩需要用到多少计算资源呢?
答案是,他们用了16个AWS云实例,每个实例搭载8块英伟达V100 GPU。成本:40美元。
他们训练的是一个标准ResNet-50,用SGD和momentum来优化。
而所用的方法,简单来说融合了这些技术:
逐步调整图像大小:fast.ai提出了在分类任务里要渐进式地调整图像大小(progressive image resizing),先用小图片训练,然后逐渐增大。
在验证中使用长方形图像:以往,人们在图像识别中都需要把原图剪成固定尺寸的正方形,而他们这一次所用的库会自动将固定尺寸的模型转换成动态尺寸模型,绕开了这一步。
如下图所示,左上是原图,右上是fast.ai使用的长方形图像,左下是标准方法裁剪的正方形,而右下是多次裁剪方法裁出的正方形。
Google Brain动态批次大小的一种变体:他们为中间的一些训练周期使用了更大的批次,这样能更好地利用GPU RAM,防止网络延迟。
腾讯4分钟训练ImageNet方法对权重衰减调整的处理方式:这种方法去掉了批次标准化(batchnorm)层里的权重衰减,能在固定的训练时间里多训练几个周期。
为了经济地在多台机器上运行多个实验,更方便地运用AWS比较便宜的“Spot实例”,他们构建的系统里用一个Python API来启动和配置新实例、运行实验、收集结果、查看进程,还开发了一个连接调度程序(nexus-scheduler)来帮助分散式实验更好地迭代。
在连接调度程序里还能通过Tensorboard查看网络利用情况
基本的分散式计算是用英伟达的NCCL库结合PyTorch的all reduce分散式模块实现的。
就是这样一套方法,实现了前边所说的40美元、16个AWS实例、18分钟训练整个ImageNet的成绩。
接下来,他们还打算继续优化方法,进一步加快训练速度。另外,这个团队还计划8月25日正式发布nexus-scheduler,其中融合了fast.ai工具的功能。
最后,附一道通往原文的传送门:
http://www.fast.ai/2018/08/10/fastai-diu-imagenet/
—完—
加入社群
量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
相关文章
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15
华为mate20pro系列手机首发上市日期价格,屏幕和电池参数配置对比2023-02-17 18:42:49
小米MAX4手机上市日期首发价格 骁龙720打造大屏标准2023-02-17 18:37:22
武汉弘芯遣散!结局是总投资1280亿项目烂尾 光刻机抵押换钱2023-02-16 15:53:18
谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠2023-02-16 13:34:45
巴斯夫将裁员6000人 众化工巨头裁员潮再度引发关注2023-02-13 16:49:06
人手不足 韵达快递客服回应大量包裹派送异常没有收到2023-02-07 15:25:20
资本微念与李子柒销声匿迹谁赢? 微念公司退出子柒文化股东2023-02-02 09:24:38
三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办2023-01-24 10:10:02
华为Mate50 RS保时捷最新款顶级手机2022多少钱?1.2万元售价外观图片吊打iPhone142023-01-06 20:27:09
芯片常见的CPU芯片封装方式 QFP和QFN封装的区别?2022-12-02 17:25:17
华为暂缓招聘停止社招了吗?官方回应来了2022-11-19 11:53:50
热血江湖手游:长枪铁甲 刚猛热血 正派枪客全攻略技能介绍大全2022-11-16 16:59:09
东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?2022-10-22 15:21:55
苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次2022-10-03 22:13:45
苹果美版iPhone可以在中国保修 从哪看怎么查询iPhone的生产日期?2022-09-22 10:00:07










