大资料文摘专栏作品
作者:Christopher Dossman
编译:conrad、Jiaxu、云舟
呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!
AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。
每周更新,做AI科研,每周从这一篇开始就够啦!
本周关键词:神经网络、机器人、文字分析
本周热门学术研究
HO-3D资料集释出,机器手逆
研究人员最近释出了HO-3D,这是一个大规模的资料集,具有不同的手持物件互动与手和物件姿态的三维注释。他们还介绍了基于资料集的高效注释和预测方法。
HO-3D基于全域性优化,利用深度、颜色和时间约束来有效地注释序列,研究人员使用该方法训练了一种新的方法,用于从一张单色影象预测手部和物体的三维姿态。
HO-3D资料集由8个不同的人操作不同物件的RGB-D序列组成,并在检视中手工注释以评估3D姿态。
更多的高质量资料意味着模型会更准确,HO-3D对于开发高度鲁棒的模型具有重要作用,因为它能够帮助模型进行有效训练。这一资料集将鼓励研究人员开发更好的注释方法,可以被应用于单RGB-D摄像机捕获和序列注释,从而为改进手部和物件姿态估计提供额外的训练资料,激发出计算机视觉和机器人领域更有效的应用。
原文:
https://arxiv.org/abs/1907.01481
公交车等候时间太长?机器学习帮你预测延迟
Google地图为全球数百个城市的公交车提供了实时交通预测服务。为了建立这个模型,他们从公交站点接收到的公交位置序列中提取了训练资料,并将其与公交车行驶路线上的车速进行了比对。
为了捕捉特定街道、社群和城市的独特属性,Google让模型学习不同大小区域的表示层次结构,模型中使用时间轴单元的地理位置表示为其在不同尺度上的位置嵌入的总和。
该模型被分解为一系列时间轴单元,包括访问街道街区和每个对应于巴士时间轴的站点,每个单元预测持续时间。由于不频繁的取样,公共汽车的高速移动,以及某些较小的街区和车站,一对相邻的观测通常跨越许多单元。
该模型显著提高了全球数百万人的交通正时精度。考虑到数以百万计的人在城市旅行中依赖于乘坐公交车,该方法能够实现清晰的预测,使使用者更容易规划他们的旅行。
原文:
https://ai.googleblog.com/2019/06/predicting-bus-delays-with-machine.html
Brno移动OCR资料集
捷克布林诺理工大学的研究人员引入了移动OCR资料集(B-MOD),用于从手持移动装置捕获的低质量影象中识别档案光学字元。
虽然OCR高质量的扫描档案是一个成熟的领域,目前已有很多可用的商业工具,并且网络上也有大型文字资料集的存在,却没有现有的资料集可以用来开发和测试对于非均匀照明,模糊影象,强噪生资料,内建去噪,锐化、压缩和其他出现在移动装置照片中的档案鲁棒的OCR方法。
该资料集包含了2000多页随机科学论文的独特页面,这些论文是由多人使用23种不同的移动装置拍摄的。最终得到了19728张各种视觉质量的照片,伴随着精确的位置和50万行的文字注释。它们进一步提供了一种评估方法,包括评估服务器和带有非公开注释的测
所提供的资料集将使未来开发和评估低质量影象的档案分析成为可能。它主要用于行级文字识别,并可进一步用于行定位、布局分析、影象恢复和文字二值化。
原文:
https://arxiv.org/abs/1907.01307v1
神经网络认证,AI、机器人研究生的福音
尽管有关AI应用的安全研究的数目日益增长,但目前针对的AI程式验证机制可用的工具、方法及教学材料仍显不足。
作为教学专案的一部分,Heriot-Watt 大学最近开设了LAIV实验室。LAIV,全称为人工智能及其验证实验室,招纳了大量人工智能和机器人专业研究生。研究人员目前就LAIV的成功和困境进行了总结,发现大部分为预料到的问题都是由现有的程式语言的局限性引起的。

随着人工智能应用的增加,AI社群如何武装自身,以解决当前面临的挑战,对未来的发展至关重要。
对于想要掌握轻量级神经网络验证的AI和机器学习从业者及学生,这项工作通过对程式语言及工具的空间设计,为AI的验证工作提供了未来的研究方向。
研究人员概述了AI和机器人学生目前可用的两种主要验证途径。 一个是基于整合到Python中的自动化定理证明的想法。 另一种是基于像Coq这样的ITP。 这项工作表明,自动验证更符合验证单个网络的对抗性稳健性的想法,而互动式证明在很大程度上不能用于此目的,但更适合验证神经网络更一般的属性。
原文:
https://arxiv.org/abs/1907.01297v1
社会文化资料的文字分析
文字分析能否为人们提供关于重大事件的新视角?尽管人类读者在阅读过程中能够更好地进行逻辑推理,理解歧义并联系相关的文化知识,但有限的时间和精力限制了人类涉猎的广度。
最近释出的一项研究分享了一些计算机文字分析方面的经验。尽管本文所用的方法并不处于研究最前沿,却为一些棘手问题提供了解决方案。此外,该工作还分享了一些处理厚重的社会文化概念的实践经验。
计算文字分析为探索一些最紧迫的当代文化和社会问题提供了新的可能性。虽然这项工作是基于研究人员自己的经验,所以难免有局限性,但它提供了多种学科背景和研究的实践经验,可以促进跨学科合作。
对于激发计算文字分析在社会文化领域的潜力而言,跨学科的见解和合作非常重要。 这项工作可以帮助研究人员更清楚、广泛地看到和探索关于文化和社会的微妙模式。
原文:
https://arxiv.org/abs/1907.01468v1
其他爆款论文
最新点云生成模型的优秀表现:
https://arxiv.org/abs/1906.12320v2
探索音讯合成新手段,激发音乐创造力:
https://arxiv.org/abs/1907.00971v1
实时重定位效能的更优实现:
https://arxiv.org/abs/1810.12163v2
使用人工生成图片预测机器人关键点:
https://arxiv.org/abs/1907.01879
XNect帮助下的多人3D实时动态捕捉:
https://arxiv.org/abs/1907.00837
AI新闻
机器人过程自动化(RPA)是企业自动化的未来吗?
https://www.forbes.com/sites/jeanbaptiste/2019/07/03/why-softbank-invested-300-million-in-robotic-process-automation-rpa/#53c4c4377e6f
GoogleAI公布油管8M资料集:
https://ai.googleblog.com/2019/06/announcing-youtube-8m-segments-dataset.html
麻省理工学院开发了一种微型步进电机,可帮助复杂机器人自行组装:
https://techcrunch.com/2019/07/02/mit-develops-tiny-walking-motor-that-help-more-complex-robots-self-assemble/





























