报价宝 > 科技 >

使用OpenCV、Tensorflow和Fastai 构建实时手动关键点检测器

消息来源:baojiabao.com 作者: 发布时间：2026-05-19

报价宝综合消息使用OpenCV、Tensorflow和Fastai 构建实时手动关键点检测器

点选上方关注，All in AI中国在本文中，我将逐步向您展示如何使用OpenCV、Tensorflow和Fastai（Python 3.7）构建您自己的实时手动关键点检测器。

您可以在此处检视模型：

浅绿色框检测到影象中的手，然后通过连线洋红色点来裁剪影象，然后输入CNN来进行手部关键点检测

动机：

这一切都始于对人工智能核心动力的痴迷。五个月前，我第一次尝试掌握不同概念之间的细微差别时，用Google搜寻了“人工智能、机器学习与深度学习”。

在看了多个视讯和文章之后，我决定从计算机视觉开始，用移动摄像头开发自己的手控关键点检测器。

通过使用移动相机开发自己的手部关键点检测器来开始计算机视觉。

我知道人类的大脑只需要20瓦就能执行，我的目标始终是保持简单，并尽可能缩小任何模型的计算要求。复杂的事情需要复杂的微积分，而这本身就是高能耗的。

关于我的学习曲线：

我有一个土木工程学术背景和一些基本的视觉编码技能。我毕业后一直在金融领域工作。

非常罕见，我通过学习Javascript（ex1，ex2）开始了我的旅程。这帮助我理解了程式码背后的“通用逻辑”，当我稍后开始学习Python和Django时，它确实很有用。

经过三个半月的密集编码后，我开始阅读吴恩达的机器学习课程，同时阅读了数百篇文章。通过从头开始构建我自己的人工神经网络以及编码传播和反向传播来了解引擎盖下的所有机制非常重要。

管道：

我用相机检测手部关键点的过程遵循以下架构：

用于手部关键点检测的pipline

⁃抓住影象的相机;⁃第一个深度学习模型检测影象上的手，并估计其周围框的座标（通过手动检测重新训练tensorflow物件检测API模型完成，您也可以通过构建定制的深度学习模型来实现）;⁃第二个深度学习回归模型将影象放在框内并估计所有手部关键点的座标（通过从具有自定义头部的resnet34迁移学习来实现）。手检测：

对于这部分，我决定在手持资料集上重新训练tensorflow的物体检测模型（在COCO资料集上训练）。我选择MobileNet_v2来提高速度。

我不会详细介绍这部分内容。您可以从公共资源中找到许多教程。

如果您使用的是Open Image资料集，我已经编写了一个自定义指令码来将资料转换为所需的格式：

重新训练模型花了我大约6个小时。

关键点检测：

在坚持使用Fastai之前，我尝试了不同的方法：

1-我首先尝试使用Keras和Tensorflow，但在早期阶段就面临资料扩充的挑战。我别无选择，只能使用Tensorpack（一个低阶api）用Python实现我自己的资料增强，因为我必须执行的转换很复杂，所有的影象变换也都会影响以Json或Csv格式储存的座标。

2-第二种方法是在灰度影象上绘制与每只手相关的座标的位置（见下图蒙版），并使用Keras的DataImageGenerator在两个影象及其相应的蒙版上执行资料增强。该模型在指标（损失和准确性）显示的情况下表现良好，但预测是混乱的。我想不出哪里出了什么问题，于是换了一种方法。 Keras是一个很棒的API，但在我的例子中很难除错。

手工关键点掩模（灰度影象）

3-下一步的行动被证明是成功的。看完Fastai之后，我决定尝试一下。 Fastai的第一个优势在于您可以除错所有程式码。第二个优点是座标增强是库核心开发的一部分。

我遵循了第一个教程来适应它，并开始在Jupyter笔记本上立即实现我的程式码。

关于Fastai和Pytorch最有趣的事情是整个程式码总结为以下指令码：

在执行“learn.lr_find（）”和“learn.recorder.plot（）”之后，为了确定最佳学习速率，我在不同周期（在CPU上）总共运行了3天的程式码。

最后一个循环“learn.fit_one_cycle（36，slice（6e-3））”结果如下：

要进行预测，请使用以下程式码之一：

img = im.open_image（\'path_to / hand_image.png\'）

preds = learn.predict（img）

img.show（Y = preds [0]）

或者：

img = im.open_image（\'path_to / hand_image.png\'）

preds = learn.predict（img）

preds = preds [1] + torch.ones（21,2）#denormalizing

preds = torch.mm（preds，torch.tensor（[[img.size [0] / 2,0]，

[0，img.size [1] / 2]]，D型细胞= torch.float））

preds = ImagePoints（FlowField（img.size，preds））

img.show（Y = preds）

推理和视觉化：

使用learn.export（）汇出模型以进行推理。您应该注意到Fastai汇出Reshape函式和自定义损失类时失败了。在引用模型进行推理之前，应将这些内容合并到您的指令码中。

要绘制关键点，您需要在视觉化程式码中新增以下内容：

第一：

learn = load_learner（\'path_to_export.pkl\'）＃载入之前使用learn.export（）储存的推理模型

然后：

我从哪里开始？

1-我想用深度学习开发股权交易模型。我过去开发定量模型，它们实施起来既冗长又复杂。现在我很想知道通过DL看市场是什么样子的。

2-此外，我想在计算机视觉和增强现实的交叉点上放下一些有趣的端到端ios应用程序。

2019-12-31 08:50:00

文章标签: 报价宝降噪耳机价格耳机价格红米手机价格华为手机价格小米手机价格电视机价格笔记本电脑价格笔记本价格汽车价格手机价格汽车价格笔记本价格电视机价格小米手机价格

相关文章

B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假浮夸不能只罚酒三杯
2023-02-17 18:46:15
华为mate20pro系列手机首发上市日期价格，屏幕和电池参数配置对比
2023-02-17 18:42:49
小米MAX4手机上市日期首发价格骁龙720打造大屏标准
2023-02-17 18:37:22
武汉弘芯遣散!结局是总投资1280亿项目烂尾光刻机抵押换钱
2023-02-16 15:53:18
谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
巴斯夫将裁员6000人众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
人手不足韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
资本微念与李子柒销声匿迹谁赢？微念公司退出子柒文化股东
2023-02-02 09:24:38
三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
华为Mate50 RS保时捷最新款顶级手机2022多少钱？1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
芯片常见的CPU芯片封装方式 QFP和QFN封装的区别？
2022-12-02 17:25:17
华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
热血江湖手游：长枪铁甲刚猛热血正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45
苹果美版iPhone可以在中国保修从哪看怎么查询iPhone的生产日期？
2022-09-22 10:00:07

最新资讯

炒港股要补交多少税？我也接到催交补税特别行动的电话了
2025-07-23 17:36:43
淘宝天猫仅退款属于诈骗吗？淘宝天猫开始部分取消仅退款
2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰
2024-10-01 11:22:38
白嫖党｜山西大同大学学生网购申请“仅退款”被拒骂客服一小时
2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书阿里巴巴竞赛受质疑
2024-06-28 10:07:40

手机

中国11月手机出货量增34% 5G手机出货量2709.2万部
2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列，新款上市价格分期0首付3999元起
2023-03-06 16:12:32
美国商务部指违禁，长江存储被美国拜登制裁名单面临停工裁员
2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌
2023-02-02 17:33:27
香港去哪买三星手机回来吗？买香港便宜售价手机市场地点和网站
2023-02-02 11:03:11

数码

华为5G芯片正式亮相：预示华为将发首款5G手机
2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划
2023-02-17 23:32:30
三星手机份额大跌！三星手机中国市场份额变化国内仅剩3%
2023-02-01 17:06:15
三星手机份额大跌在中国没市场了！国内市场占有率仅剩1%国外比苹果销量高
2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载：简洁流畅无广告！
2022-12-02 17:29:30

科技

B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假浮夸不能只罚酒三杯
2023-02-17 18:46:15

品牌选车

选择品牌

选择车系

选择车型