报价宝 > 科技 >

神脑补只要一段话就知道你的说话手势 | UC伯克利_预测

消息来源:baojiabao.com 作者: 发布时间：2024-05-14

报价宝综合消息神脑补只要一段话就知道你的说话手势 | UC伯克利_预测

防不胜防！现在， AI只需要听你的声音，就能知道你说话手势了。

这项“脑补力”Max的新研究，来自UC伯克利大学等机构，被今年的学术顶级会议CVPR 2019收录。

不信？看看美国知名脱口秀Last Week Night主持人Oliver就知道了，他的手势已经被AI研究透了。说话的时候，肩膀什么角度，手指如何挥动，预测得一清二楚。

看到这项研究之后，就有网友评论称，不知道它能不能预测川普的魔性手势？

也有人表示，还好这只是项研究，如果能够应用到现实中，那还了得？

以后打电话，一边在电话里说着爱对方，一边却搞著小动作，会暴露的。

手势，是人们在说话过程中自发发出的行为，用于补充语音资讯，来帮助更好地传递说话人的想法。

通常情况下，说话的时候，手势与话语都是有关联的。但想要从话语中获取手势资讯，还需要学习音讯和手势之间的对映关系。在实践中，还有不少麻烦：

为了解决这些问题，研究人员提出了一种时间跨模态翻译的方法，采用端到端的方式将语音转换成手势，并使用了范围非常大的时间背景来进行预测，以此克服异步性问题。

他们建立了一个由10名说话人组成的144个小时的大型个人视讯资料集。为了体现出模型的适用范围，说话人的背景不尽相同：有电视节目主持人、大学教师和电视上的福音传道者。

给定一段语音，通过翻译模型（G）预测说话人与话语匹配的手势动作（手和胳膊的运动）。

然后采用回归函式（L1）从资料中提出训练讯号，并通过度抗性鉴别器来确保预测的只是在时间上与话语是一致的，并符合说话人的风格。

整个卷积网络，由一个音讯编码器和一个1D UNet翻译架构组成。音讯编码器采用2D对数-梅尔频谱图作为输入，并通过一系列卷积对其进行下采样，从而产生与视讯取样率相同的1D讯号(15 Hz)。

UNet翻译架构随后通过L1回归损失学会将该讯号对映到手势向量的时间堆叠。

之所以使用UNet架构进行翻译，是因为它的瓶颈为网络提供了过去和未来的时间上下文，允许高频时间资讯流过，从而能够预测快速的手势运动。

虽然L1回归是从资料中提取训练讯号的唯一方法，但它存在回归均值的已知问题，这种回归均值会产生过度平滑的运动。为了解决这个问题，添加了一个以预测的姿态序列的差异为条件对抗性鉴别器。

这一研究的作者，大部分来自UC伯克利。

一作为Shiry Ginosar，UC伯克利计算机系的博士生。之前是人机互动领域的研究员，曾经在CMU计算机系做访问学者。

共同一作为Amir Bar，是一名生活在伯克利的机器学习工程师。目前，在Zebra Medical Vision工作，致力于提高医疗保健领域的效率。

他们在论文中说，这一研究是朝着对话手势的计算分析迈出的一步，之后也可以用于驱动虚拟任务的行为。

http://people.eecs.berkeley.edu/~shiry/speech2gesture/

https://github.com/amirbar/speech2gesture

小程式|全类别AI学习教程

AI社群|与优秀的人交流

喜欢就点“在看”吧 !

2019-10-16 14:53:00

文章标签: 报价宝降噪耳机价格耳机价格红米手机价格华为手机价格小米手机价格电视机价格笔记本电脑价格笔记本价格汽车价格报价宝手机价格笔记本电脑价格电视机价格小米手机价格

相关文章

中兴受美国制裁事件被罚了20亿美元过程事件始末中兴被制裁后公司现状
2023-11-02 22:12:46
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假浮夸不能只罚酒三杯
2023-02-17 18:46:15
华为mate20pro系列手机首发上市日期价格，屏幕和电池参数配置对比
2023-02-17 18:42:49
小米MAX4手机上市日期首发价格骁龙720打造大屏标准
2023-02-17 18:37:22
武汉弘芯遣散!结局是总投资1280亿项目烂尾光刻机抵押换钱
2023-02-16 15:53:18
谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
巴斯夫将裁员6000人众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
人手不足韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
资本微念与李子柒销声匿迹谁赢？微念公司退出子柒文化股东
2023-02-02 09:24:38
三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
华为Mate50 RS保时捷最新款顶级手机2022多少钱？1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
芯片常见的CPU芯片封装方式 QFP和QFN封装的区别？
2022-12-02 17:25:17
华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
热血江湖手游：长枪铁甲刚猛热血正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45

最新资讯

YouTube更新违反规定政策，提升惩处透明度和一致性
2023-12-31 14:00:52
美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
小米汽车传员工3700人雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市预售价格22.99万元
2023-12-28 19:30:28
日本丰田汽车厂11月全球产量创新高
2023-12-28 19:26:02

手机

中国11月手机出货量增34% 5G手机出货量2709.2万部
2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列，新款上市价格分期0首付3999元起
2023-03-06 16:12:32
美国商务部指违禁，长江存储被美国拜登制裁名单面临停工裁员
2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌
2023-02-02 17:33:27
香港去哪买三星手机回来吗？买香港便宜售价手机市场地点和网站
2023-02-02 11:03:11

数码

华为5G芯片正式亮相：预示华为将发首款5G手机
2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划
2023-02-17 23:32:30
三星手机份额大跌！三星手机中国市场份额变化国内仅剩3%
2023-02-01 17:06:15
三星手机份额大跌在中国没市场了！国内市场占有率仅剩1%国外比苹果销量高
2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载：简洁流畅无广告！
2022-12-02 17:29:30

科技

中兴受美国制裁事件被罚了20亿美元过程事件始末中兴被制裁后公司现状
2023-11-02 22:12:46
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09

品牌选车

选择品牌

选择车系

选择车型