报价宝 > 科技 >

人工智能-OCR识别资料模拟利器介绍

消息来源:baojiabao.com 作者: 发布时间：2024-05-29

报价宝综合消息人工智能-OCR识别资料模拟利器介绍

人工智能方向很多，其中OCR作为图片文字识别，在很多方面得到运用，例如：网络安全公司通过爬虫网络图片，对图片上的文字识别分析，从而判定其是否含有特定色彩资讯等。对图片上的文字有效识别，方便了文字的携带和再次重复使用，只需对需要识别的图片拍摄扫描就可识别其文字资讯，大大简化人的工作量。

OCR识别的第一步便是资料准备，资料作为训练好坏的关键，往往具有一定重要性，巨大的资料量也是模型识别能力的重要保障。而OCR资料准备不像图片识别目标检测那样需要人工标注，因其资料需求简单，因此，算法开发者通常通过程式自动生成训练资料，本人之前做中文、英文、日语等多种语言OCR识别过程都是通过程式模拟。而丰富多样的资料格式，有利于提高模型的泛化能力。今天给大家介绍一个GitHub开源的OCR字元识别利器。

GitHub地址：https://github.com/Belval/TextRecognitionDataGenerator

该专案下载后可以直接在本地执行，支援中文、英文资料模拟，使用者只需要按要求将字型和语料库放到指定目录即可。

通过如下命令即可模拟资料：

生成模拟资料入口

如下是模拟的英文OCR训练资料：

模拟的英文OCR训练资料

当然，在真实场景中，如上资料远远不能满足需求，该专案提供了配置引数，通过 - k命令可以生成倾斜或呈对角线排列的资料，如下：

对角线排列的OCR训练资料

这种对角线排列的资料在训练过程很有意义，对提高模型的泛化和抗噪能力至关重要。

不仅如此，该专案提供了波浪形状的模拟资料，通过- d引数即可生成。

呈波浪形的OCR训练资料

这种资料加入OCR训练过程，通过实验，对模型能力提升特别大。

不仅如此，专案提供了-d引数的以图片作为背景的OCR资料。

以图片作为背景的OCR模拟资料

这种资料只需要开发者将搜集到的背景图片放到指定目录，程式在模拟过程会自动读取并模拟，本人在一步步除错其源代码的时候，对其做了很多修改。

该专案还支援手写字元识别的资料模拟，通过-hw引数控制。

手写OCR资料模拟

作者还提供了模拟速度结果：

模拟速度对比

可以看到，不同环境中模拟的图片速度不同，开发者只有指定引数即可。目前，该专案已经有673个star，fork286次，可以说得到了很多人的喜欢，如果你也从事或者准备从事人工智能中的OCR方向，不妨以此作为你的模拟资料利器，相信一定会给你带来意想不到的惊喜和模型效果。

喜欢的朋友可点选关注哦，有问题欢迎大家随时留言。

2019-10-23 08:56:00

文章标签: 报价宝降噪耳机价格耳机价格红米手机价格华为手机价格小米手机价格电视机价格笔记本电脑价格笔记本价格汽车价格笔记本电脑价格小米手机价格华为手机价格红米手机价格耳机价格

相关文章

中兴受美国制裁事件被罚了20亿美元过程事件始末中兴被制裁后公司现状
2023-11-02 22:12:46
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假浮夸不能只罚酒三杯
2023-02-17 18:46:15
华为mate20pro系列手机首发上市日期价格，屏幕和电池参数配置对比
2023-02-17 18:42:49
小米MAX4手机上市日期首发价格骁龙720打造大屏标准
2023-02-17 18:37:22
武汉弘芯遣散!结局是总投资1280亿项目烂尾光刻机抵押换钱
2023-02-16 15:53:18
谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
巴斯夫将裁员6000人众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
人手不足韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
资本微念与李子柒销声匿迹谁赢？微念公司退出子柒文化股东
2023-02-02 09:24:38
三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
华为Mate50 RS保时捷最新款顶级手机2022多少钱？1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
芯片常见的CPU芯片封装方式 QFP和QFN封装的区别？
2022-12-02 17:25:17
华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
热血江湖手游：长枪铁甲刚猛热血正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45

最新资讯

YouTube更新违反规定政策，提升惩处透明度和一致性
2023-12-31 14:00:52
美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
小米汽车传员工3700人雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市预售价格22.99万元
2023-12-28 19:30:28
日本丰田汽车厂11月全球产量创新高
2023-12-28 19:26:02

手机

中国11月手机出货量增34% 5G手机出货量2709.2万部
2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列，新款上市价格分期0首付3999元起
2023-03-06 16:12:32
美国商务部指违禁，长江存储被美国拜登制裁名单面临停工裁员
2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌
2023-02-02 17:33:27
香港去哪买三星手机回来吗？买香港便宜售价手机市场地点和网站
2023-02-02 11:03:11

数码

华为5G芯片正式亮相：预示华为将发首款5G手机
2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划
2023-02-17 23:32:30
三星手机份额大跌！三星手机中国市场份额变化国内仅剩3%
2023-02-01 17:06:15
三星手机份额大跌在中国没市场了！国内市场占有率仅剩1%国外比苹果销量高
2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载：简洁流畅无广告！
2022-12-02 17:29:30

科技

中兴受美国制裁事件被罚了20亿美元过程事件始末中兴被制裁后公司现状
2023-11-02 22:12:46
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09

品牌选车

选择品牌

选择车系

选择车型