DeepMind给人工智能搞了一套IQ测试题
消息来源:baojiabao.com 作者: 发布时间:2024-04-25
问耕 发自 凹非寺
量子位 出品 | 公众号 QbitAI
阿基米德在泡澡的时候,发现了富力原理,也发现了如何计算王冠的体积。
这就是一种抽象推理能力。
对于智能你来说,这个能力是不可或缺的一环。对人工智能也不例外。但是,神经网络的智能到底是有推理能力,还是仅靠肤浅的统计数据?
为了回答这个问题,DeepMind想了一个方法。
给AI搞了一套IQ测试题。
例如,下面这个问题:请问右下角应该是哪个图案?
基于观察、推理能力,一个智能体可以推断出这个问题的答案。基于这样的理念,DeepMind构建了一个问题生成器,涉及一组抽象因素,包括渐进之类的关系,以及颜色和大小等属性。
虽然这个生成器使用了一组潜在因素,但仍然会产生大量独特的问题。
接下来,通过约束生成器可用的因子或组合,就可以创建用于训练和测试模型的不同问题集,看看模型究竟能“聪明”到什么程度。
通过实验,DeepMind发现,当模型在测试中能够正确推断出任务背后的抽象概念时,就能产生良好的性能表现——IQ测试正确率可达87%,否则的话,蒙对答案的概率只有32%。
这份研究结果表明,想得出关于泛化的普遍结论可能是无益的。
参与测试的模型,表现良好与否取决于一系列因素,而几乎在所有情况下,系统在需要推断超出其经验的输入,或处理完全不熟悉的属性时,表现不佳。
总之,这是一个很有意思的方向。
很多人在看到这个研究时,都发出了Interesting的评价~
如果你对这个研究感兴趣,详细的论文在此:
Measuring abstract reasoning in neural networks
传送门:
http://proceedings.mlr.press/v80/santoro18a/santoro18a.pdf
为了鼓励大家继续研究,DeepMind还开源了数据集。
传送门:
https://github.com/deepmind/abstract-reasoning-matrices
—完—
相关文章
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状
2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因
2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓
2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?
2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯
2023-02-17 18:46:15
- 华为mate20pro系列手机首发上市日期价格,屏幕和电池参数配置对比
2023-02-17 18:42:49
- 小米MAX4手机上市日期首发价格 骁龙720打造大屏标准
2023-02-17 18:37:22
- 武汉弘芯遣散!结局是总投资1280亿项目烂尾 光刻机抵押换钱
2023-02-16 15:53:18
- 谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
- 巴斯夫将裁员6000人 众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
- 人手不足 韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
- 资本微念与李子柒销声匿迹谁赢? 微念公司退出子柒文化股东
2023-02-02 09:24:38
- 三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
- 华为Mate50 RS保时捷最新款顶级手机2022多少钱?1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
- 芯片常见的CPU芯片封装方式 QFP和QFN封装的区别?
2022-12-02 17:25:17
- 华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
- 热血江湖手游:长枪铁甲 刚猛热血 正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
- 东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
- 苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45