10行代码搞一个对象检测系统
消息来源:baojiabao.com 作者: 发布时间:2024-05-07
作者简介:Moses Olafenwa是AI Commons的深度学习和计算机视觉研究员及开发员。
计算机视觉是AI的重要领域之一。计算机视觉是指计算机和软件系统可以识别并理解图像和场景这门学科。计算机视觉还包括各个方面,比如图像识别、对象检测、图像生成和图像超分辨率等。由于实际使用场景数量众多,对象检测可能是计算机视觉影响最深远的一个方面。我在本文中将简要介绍现代对象检测这一概念、软件开发人员面临的挑战、我的团队提供的解决方案以及执行高性能对象检测的代码教程。
对象检测是指计算机和软件系统能够确定图像/场景中的对象,并识别每个对象。对象检测已广泛用于人脸检测、车辆检测、行人计数、互联网图像、安全系统和自动驾驶汽车。对象检测应用于许多实际领域还有诸多方法。与另外每种计算机技术一样,对象检测的各种创造性、令人惊讶的用途肯定离不开计算机程序员和软件开发人员的努力。
将现代对象检测方法应用于应用程序和系统中,并且构建基于这些方法的新应用程序,这并非易事。对象检测的早期实现需要使用经典算法,比如OpenCV这种大受欢迎的计算机视觉库中支持的算法。然而,这些经典算法无法获得足以适用于不同情形的性能。
2012年深度学习迎来了突破,并迅速得到速采用,带来了准确度很高的现代对象检测算法和方法(比如R-CNN、Fast-RCNN、Faster-RCNN和RetinaNet)以及速度快、准确度又高的算法和方法(比如SSD和YOLO)。使用这些方法和算法(它们基于深度学习,深度学习又基于机器学习),需要扎实的数学基础,并且深入了解深度学习框架。数百万的专家级计算机程序员和软件开发人员想要集成和创建使用对象检测的新产品。但由于了解并实际使用对象检测很复杂,这项技术不在他们的享用范围之内。
我的团队几个月前意识到了这个问题,这就是为什么我和约翰?奥拉芬瓦(John Olafenwa)构建了ImageAI,这个Python库让程序员和软件开发人员可以轻松地将最先进的计算机视觉技术集成到他们的新老应用程序中,只使用几行代码即可。
想使用ImageAI执行对象检测,只需要做这几步:
1.将Python安装到你的计算机系统上。
2.安装ImageAI及其依赖项。
3.下载对象检测模型文件。
4.运行示例代码(只有短短10行)。
现在咱们开始上手吧
1) 从Python官网下载并安装Python 3。
https://python.org
2)通过pip安装下列依赖项:
i. Tensorflow
pip install tensorflow
ii. Numpy
pip install numpy
iii. SciPy
pip install scipy
iv. OpenCV
pip install opencv-python
v. Pillow
pip install pillow
vi. Matplotlib
pip install matplotlib
vii. H5py
pip install h5py
viii. Keras
pip install keras
ix. ImageAI
pip install
https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.1/imageai-2.0.1-py3-none-any.whl
3)通过该链接:https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/resnet50_coco_best_v2.0.1.h5
,下载将用于对象检测的RetinaNet模型文件。
好了。你已安装好了依赖项,可以准备编写你的第一段对象检测代码了。创建一个Python文件,并取名(比如FirstDetection.py),然后往文件里面编写下列代码。将RetinaNet模型文件和你想要检测的图像拷贝到含有python文件的文件夹。
FirstDetection.py
然后运行代码,等结果在控制台输出。一旦结果输出到控制台,进入到你的FirstDetection.py所在的文件夹,会看到一个新的图像已保存。看看下面2个图像示例和检测后保存的新图像。
检测前:
图片来源:维基共享资源
检测后:
上面图像的控制台结果:
上面图像的控制台结果:
人:63.53200078010559
现在不妨解释这10行代码是如何工作的。
在上面3行代码中,我们在第一行导入了ImageAI对象检测类,在第二行导入了python os类,在第三行定义了一个变数来保存python文件、RetinaNet模型文件和图像所在的文件夹的路径。
在上面2行代码中,我们在第一行迭代detector.detectObjectsFromImage函数返回的所有结果,然后在第二行针对图像中检测到的每个对象,输出对象的名称和模型的百分比概率。在上面5行代码中,我们在第一行中定义了对象检测类,在第二行中将模型类型设置为RetinaNet,在第三行将模型路径设置为RetinaNet模型的路径,在第四行将模型载入到对象检测类,然后在第五行调用检测函数,并解析输入图像路径和输出图像路径。
ImageAI支持对象检测过程的许多强大的定制。其中之一就是能够提取图像中检测到的每个对象的图像。只要将额外的参数extra_detected_objects = True解析到detectObjectsFromImage函数,如下所示,对象检测类就可以为图像对象创建一个文件夹,提取每个图像,将每个图像保存到新创建的文件夹,并返回含有每个图像路径的额外数组。
将它运用于第一个图像,可以从结果看到一些图像,如下所示:
所有行人的照片都被提取出来。我没有包括所有照片,它们会占用不必要的空间。
ImageAI为对象检测任务提供了多得多的功能,可用于定制和生产级部署。一些支持的功能如下:
调整最小概率:默认情况下,检测到概率百分比小于50的对象不会显示或报告。你可以为很确定的情况提高该值,或者为需要检测所有可能对象的情况降低该值。
自定义对象检测:使用提供的CustomObject类,你可以让检测类报告针对一个或几个独特对象的检测结果。
检测速度:通过将检测速度设置为“快速”、“更快”和“最快”,你可以缩短检测图像所花的时间。
输入类型:你可以指定并解析图像的文件路径、Numpy数组或图像的文件流作为输入图像。
输出类型:你可以指定detectObjectsFromImage函数应该以文件或Numpy数组的形式返回图像。
可以在官方GitHub代码仓库(https://github.com/OlafenwaMoses/ImageAI)上找到关于如何使用上述功能的详细信息和说明文档以及ImageAI所包含的其他计算机视觉功能。
相关文章
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状
2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因
2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓
2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?
2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯
2023-02-17 18:46:15
- 华为mate20pro系列手机首发上市日期价格,屏幕和电池参数配置对比
2023-02-17 18:42:49
- 小米MAX4手机上市日期首发价格 骁龙720打造大屏标准
2023-02-17 18:37:22
- 武汉弘芯遣散!结局是总投资1280亿项目烂尾 光刻机抵押换钱
2023-02-16 15:53:18
- 谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
- 巴斯夫将裁员6000人 众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
- 人手不足 韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
- 资本微念与李子柒销声匿迹谁赢? 微念公司退出子柒文化股东
2023-02-02 09:24:38
- 三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
- 华为Mate50 RS保时捷最新款顶级手机2022多少钱?1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
- 芯片常见的CPU芯片封装方式 QFP和QFN封装的区别?
2022-12-02 17:25:17
- 华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
- 热血江湖手游:长枪铁甲 刚猛热血 正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
- 东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
- 苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45