资源|TensorFlow推出模型优化工具包 可将模型压缩75%
消息来源:baojiabao.com 作者: 发布时间:2026-05-09

选自Medium
机器之心编译
参与:张倩、王淑婷
近日,TensorFlow 推出了一款新的模型优化工具包。利用该该工具包中的技术可以将模型压缩 75%,最大可将速度提升到原来的 3 倍。
新手和熟练的开发者都能利用这套工具包中的技术来优化待部署和执行的机器学习模型。预计该工具包中的技术将有助于优化所有 TensorFlow 模型以进行部署,但它对于那些为内存紧张、功率和存储受限的设备提供模型的 TensorFlow Lite 开发人员来说帮助最大。
TensorFlow Lite 相关信息链接:https://www.tensorflow.org/mobile/tflite/。
优化模型以减少尺寸、延迟和功耗,使准确率损失不明显
添加的第一项支持技术是对 TensorFlow Lite 转换工具的训练后量化(post-training quantization)。对于相关的机器学习模型,利用该技术可以将模型压缩到原来的 1/4,并将速度提升到原来的 3 倍。
开发者可以通过量化模型减少能耗。这点对于在边缘设备中部署(不局限于手机)非常有用。
实现训练后量化
训练后量化技术是 TensorFlow Lite 转换工具的一部分。上手非常简单:创建 TensorFlow 模型之后,开发者可以简单地实现 TensorFlow Lite 转换工具中的“post_training_quantize”标记。假设这一保存的模型存储在 saved_model_dir 中,则可以生成量化的 tflite flatbuffer:
converter=tf.contrib.lite.TocoConverter.from_saved_model(saved_model_dir)
converter.post_training_quantize=True
tflite_quantized_model=converter.convert()
open(“quantized_model.tflite”, “wb”).write(tflite_quantized_model)
TensorFlow 提供了相关教程,深入解析如何做到这一点。未来的目标是将这种技术纳入通用的 TensorFlow 工具中,以便将其部署在目前没有 TensorFlow Lite 支持的平台上。
教程链接:https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/lite/tutorials/post_training_quant.ipynb
训练后量化的好处
模型缩小到原来的 1/4
主要由卷积层组成的模型执行速度提高了 10-50%。
基于 RNN 的模型得到了 3 倍的加速
由于减少了内存和计算需求,预计大多数模型将降低功耗。
下图显示一些模型尺寸减小,执行速度提高(使用单核的 Android Pixel 2 手机上进行的测量)。
图 1:模型大小比较:优化后的模型差不多缩小到原来的 1/4。
图 2:延时比较:优化后的模型速度是原来的 1.2—1.4 倍。
加速和模型尺寸减小对准确率的影响很小。一般对于手头任务来说,已经较小的模型(如用于图像分类的 mobilenet v1)可能会损失更多的准确率。对于这些模型,TensorFlow 为其中的大部分提供预训练的完全量化模型。
图 3:准确率比较:除了 mobilenets,优化后的模型准确率下降不明显。
TensorFlow 期望在未来继续改进结果,所以请参见模型优化指南,了解最新的测量结果。
地址:https://www.tensorflow.org/performance/model_optimization
训练后量化如何起作用
TensorFlow 通过将参数(即神经网络权重)的精度从训练时的 32 位浮点表示降至小得多且高效的 8 位浮点数表示,来进行优化(也称为量化)。详细信息请参见训练后量化指南。
地址:https://www.tensorflow.org/performance/post_training_quantization
这些优化将确保结果模型中精度降低的操作定义与使用固定和浮点数学混合的内核实现配对。这将在较低精度下快速执行最重的计算,但在较高精度下执行最敏感的计算,因此通常会导致任务很少甚至没有最终准确率损失,但与纯浮点执行相比,速度显著加快。对于没有匹配的“混合”内核的操作,或者工具包认为有必要的操作,它会将参数重新转换为更高的浮点精度来执行。有关支持混合操作的列表,请参见训练后量化页面。
未来展望
TensorFlow 将继续改进训练后量化及简化模型优化过程的其它技术上的工作。这些将整合到 TensorFlow 相关工作流程中,使其更加容易使用。
训练后量化是 TensorFlow 正在开发的优化工具包下的第一个产品,该团队希望得到来自开发者的相关反馈。
原文链接:https://medium.com/tensorflow/introducing-the-model-optimization-toolkit-for-tensorflow-254aca1ba0a3
本文为机器之心编译,
转载请联系本公众号获得授权
。?------------------------------------------------
加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com
投稿或寻求报道:
content
@jiqizhixin.com广告 & 商务合作:bd@jiqizhixin.com
相关文章
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15
华为mate20pro系列手机首发上市日期价格,屏幕和电池参数配置对比2023-02-17 18:42:49
小米MAX4手机上市日期首发价格 骁龙720打造大屏标准2023-02-17 18:37:22
武汉弘芯遣散!结局是总投资1280亿项目烂尾 光刻机抵押换钱2023-02-16 15:53:18
谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠2023-02-16 13:34:45
巴斯夫将裁员6000人 众化工巨头裁员潮再度引发关注2023-02-13 16:49:06
人手不足 韵达快递客服回应大量包裹派送异常没有收到2023-02-07 15:25:20
资本微念与李子柒销声匿迹谁赢? 微念公司退出子柒文化股东2023-02-02 09:24:38
三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办2023-01-24 10:10:02
华为Mate50 RS保时捷最新款顶级手机2022多少钱?1.2万元售价外观图片吊打iPhone142023-01-06 20:27:09
芯片常见的CPU芯片封装方式 QFP和QFN封装的区别?2022-12-02 17:25:17
华为暂缓招聘停止社招了吗?官方回应来了2022-11-19 11:53:50
热血江湖手游:长枪铁甲 刚猛热血 正派枪客全攻略技能介绍大全2022-11-16 16:59:09
东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?2022-10-22 15:21:55
苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次2022-10-03 22:13:45
苹果美版iPhone可以在中国保修 从哪看怎么查询iPhone的生产日期?2022-09-22 10:00:07










