APP下载

2019年5月 百度大脑产品上新&技术升级盘点_识别

消息来源:baojiabao.com 作者: 发布时间:2026-05-19

报价宝综合消息2019年5月 百度大脑产品上新&技术升级盘点_识别

与百度大脑一起成长,见证 AI 的力量!

AI 开放能力

语音合成:全新推出精品音库

语音合成新增5个精品音库,童声音库度米朵、度小童,情感男声度博文,情感女声度小娇、度小雯,满足更多场景需求。

文字识别 OCR

人体分析

人体检测与属性识别模型升级

模型升级,21类属性的平均准确率从84.4%提升至88.1%。

影象识别

AI 开发平台

新开放4个开发平台: EasyDL 定制视讯分类、智慧视讯监控开发平台、一站式内容稽核平台、 iOCR 财会版;智慧对话训练和服务平台 UNIT 全面升级至3.0。

EasyDL 定制视讯分类

面向视讯分析场景,通过标注每类50个、10 s 以内的视讯片段进行训练,从而实现“需要连续图片帧组合判断”的视讯内容分析,可用于定制工人操作行为规范识别 AI 模型、定制物体移动方向判断的 AI 模型等业务场景中。

智慧视讯监控开发平台

由监控系统框架与众多视觉技能(技能是模组化的程式码,包含 AI 模型,输入图片,可以输出检测结果)组成的配置平台。使用者通过选择技能组合并由平台自动将其与系统框架有机组合起来,即可得到一个完整的监控系统,实现陌生人、未佩戴安全帽等违规行为识别。

一站式内容稽核平台

全型别、多维度整合百度大脑视觉、语音、语义能力,业界最全;基于多年业务积累,模型精度业界领先;对接海量人物库,动态更新,针对突发事件,使用者可自助新增人脸,快速拥有定制稽核能力。

iOCR 财会票据识别

1)新增票据检测分类功能,可直接识别发票贴上单上的多张不同型别发票;

2)系统预置7种报销常用票据模板、4大行及招商银行的银行对账单模板,可满足80%以上财会场景需求;

3)对于特殊票据,支援快速自定义模板及分类器;

4)底层模型针对财会场景进行专项优化:支援自动去红章;支援套打偏移识别;金额数字识别精度更高。

理解与互动技术 UNIT 3.0

1)重磅释出“我的知识”,一站式实现知识挖掘与语义理解

“我的知识”模组在 UNIT 中引入了百度知识图谱通用演算法集合,帮助开发者使用自有资料构建企业图谱知识库与问答知识库,挖掘的知识可用于优化技能模型的理解效果、完善对话流程的控制与答复。

2)全新推出“对话式档案问答”,汇入业务档案自动构建对话模型

基于“对话式档案问答”技术,开发者只需汇入业务档案,即可自动构建出基于档案理解的对话技能,允许开发者对对话效果进行调优,具备持续学习能力,大幅降低了产品介绍、说明等场景下的智慧业务问答开发成本。

3)全新发布对话日志挖掘工具“ DataKit ”,大幅提升模型调优效率

离线对话日志挖掘工具 DataKit ,支援从对话日志中挖掘出对话训练样本,来训练、优化对话模型的理解效果,帮助开发者低成本地不断提升模型理解效果,样本生产和标注效率平均提升8倍。

4)开放支援自定义调优的离线 SDK ,确保断网环境下的语义解析能力

具有端计算能力的离线 SDK ,可提供智慧车载、智慧家居等多个场景下的离线场景档案,并支援自定义调优,实现装置在断网环境下也可以提供语义解析服务。

5)预置技能增至58个,满足更多场景需求

新上线可定制预置技能3个,包括会议室预定、电台控制、购买药品,开发者可以根据业务需求调整这些技能的词典,让预置技能效果更贴合业务;同时还上线了含资源预置技能:成语问答、计算器、进位制转换、单位换算,可直接解析出问题的答案。

整合与部署

高效能运算卡 EdgeBoard 软核升级

1)网络模型阵容继续壮大,新增支援网络 mobilenet-ssd 、 densenet ,总计已支援10个网络结构;

2)多项能力持续升级,视讯输入支援 mipi 摄像头,预测结果支援 DP ( DispalyPort )直接实时显示, YUV 资料支援高速转 RGB 。

高价效比计算卡 PaddlePi-K210 重磅首发

Paddle Pi-K210 是一款由百度大脑与嘉楠耘智共同打造、适配 PaddlePaddle 模型的深度学习计算卡,包含 AI Studio 模型训练、应用开发、模型部署等整套解决方案。开发应用便捷、周边配套完整、百元级优质终端核心运算模组,用于 AI 核心运算处理单元。

私有化部署方案升级

全面支援 AI 能力在物理机,虚拟机器器,云服务器三种环境下的私有化部署。新增支援 AI 能力在百度云服务器上的私有化部署:

1)满足使用者资料安全的需求,实现云上使用者专属 AI 服务;

2)提升运维效率,享受简单高效的云服务器资源管理。

场景方案

呼叫中心语音场景方案

包括呼叫中心场景专属语音识别模型和语音合成专属音库;适配 MRCP 标准协议,与对话系统深入配合,灵活支援打断等需求;全双工流式互动,提供低延迟、高并发的企业级语音服务。

虚拟真人助理场景方案

针对视讯、媒体、广电行业需求,基于百度领先的人工智能和深度学习技术,提供定制虚拟视觉助理形象的解决方案,从而丰富使用者产品形态,提高节目互动娱乐趣味性,降低运营成本。

百度 AI 市场

AI 市场移动版上线

AI 市场客户可通过移动装置,随时随地浏览与分享商品与店铺,并可拨打电话或提交咨询单与服务商及时沟通。 AI 市场移动版已全面推广,为服务商提供新流量入口。

商品展示支援多图与视讯

商品编辑增加多图和视讯上传功能,商家可为商品资讯新增多张细节图片描述、短视讯描述。同时对商品的资讯丰富程度进行了量化,丰富度高的商品会在平台推广中享有更多的推广机会。

优质服务商及商品持续入驻

北京嘉楠捷思、无锡沃克特、青岛阿波牛、上海品览、上海图漾等多家优质服务商于 AI 市场上线售卖合作款芯片、人脸识别门禁、镜头模组、智慧机器人等硬件产品,以及智慧农业、工业监测、 SKU 识别等解决方案,价效比高,品质有保障。

1)沃克特10.1寸人脸识别终端

10.1寸人脸识别终端,高清摄像头,识别速度快,活体检测,防照片伪认证。

2)图漾科技 3D 摄像头 FS830-HD

双目结构光 RGBD 3D 摄像头,工作距离0.24-3.5米,尺寸 130*32*36( mm )。适用于 3D 活体检测,机器人避障。

限时优惠活动

7家服务商传送3000元优惠券

赛蓝、慧谷航天、睿识、贝塔、视派尔、奥比中光、麦哲7家热销服务商各传送3000元满减优惠券,有效期至2019年12月31日。您可在以上 AI 市场移动版内领取以上7家服务商的优惠卷,并在 AI 市场内下单相应商品、填写优惠码即可享受丰厚优惠。

检视更多详情请点选“阅读原文”。

2020-01-01 08:50:00

相关文章