APP下载

微软亚洲研究院院长洪小文:AI应用可先从重复性高的工作切入,要像人脑运作还有很大落差

消息来源:baojiabao.com 作者: 发布时间:2024-05-19

报价宝综合消息微软亚洲研究院院长洪小文:AI应用可先从重复性高的工作切入,要像人脑运作还有很大落差
图片来源: 

何维涓_摄影

亚洲微软研究院于今日举办Academic Day 2017,聚焦于AI结合多项技术发展的新应用,多位微软研究员都一同出席,发表了多项最新的研究。其中,微软亚洲研究院首席研究员Katsu Ikeuchi专精于电脑视觉与人工智能,这次更是在演讲中展示,机器人能够纪录并模仿台湾原住民舞蹈,中央研究院资讯科学研究所研究员Mark Liao则是展示将观众录下的片段演唱会影片,重新分析影像和音质,创造出不重复且高品质的完整演唱会影音,科技部前政务次长林一平发表在台中、新竹和台南科学园区试行的Smart Science Park专案,能够透过多项IoT装置,利用电脑视觉和人工智能技术,提供更便利的服务给使用者。此外,还有由微软实习生所创作的10项多元创新应用Demo。

“AI与人刚好互补,”微软亚洲研究院院长洪小文表示,AI硬记的能力很强,刚好是人类比较弱的地方,而人类拥有感知能力、创造力和意识,正是AI没有的能力,他认为有许多问题是需要AI加上HI(Human Intelligence)协同合作,而目前AI最擅长的则是处理重复性高的工作,且必须在没有外来因素影响的封闭式环境下,若是不常遇到的问题,由于收集的数据不足,无法训练模型,且投入成本过高也不适合采用。

不过他也坦言,AI目前的技术离人脑的运作模式还有一大段落差,他认为,由于大家对人脑的运作了解还太少,且人类脑部许多复杂的运作是无从解释的,AI要达到模仿人脑短期之内是不太可能。

Katsushi Ikeuchi利用拉班舞谱(Labanotation)的原理分析人类肢体动作,将人的动作分为8个方向,再透过机器学习算法,让机器人用电脑视觉的技术记录下拆解过的动作资讯,再转化为生成动作的程式,让机器人可以模仿舞蹈动作,Katsushi Ikeuchi展示了机器人跳民俗舞蹈和台弯原住民舞蹈的影片,他认为可将机器人跳舞的研究套用在许多领域中,像是居家陪伴或是医疗照护等,甚至可以打造服务型的机器人。

Katsushi Ikeuchi也看见台湾发展新科技的机会,他认为,虽然台湾市场规模虽然较小,但是却有可以快速转变的优势,因此,若要在台湾尝试发展新技术是非常有潜力的。

另外一项AI创新的研究则是Mark Liao发表的演唱会影片重组,他将观众参加演唱会后录制的片段影片,拼成一个完整高品质的影片,由于拍摄的时间、取景、设备不同,他则要面临影片品质的统一、影片片段不重复等问题,要如何选影片更是一大学问,光是要选影片音质好的片段,还是画质好的也是个问题,他将每段影片利用六大镜头拍摄方式分类,再经过深度学习算法挑选出最适合的片段,最后再将片段的影片,拼成一个拥有完整内容,且不重复的影片。

微软实行生所创作的10项多元创新应用Demo中,有项AI应用是让系统可以看图作诗,这项研究是由台湾大学徐宏民教授、林守德教授和亚洲研究员宋睿华一同指导,台湾大学资工研究所一年级研究生吴肇中与网络多媒体研究所毕业生郑文峰去年在微软实习时,一开始发想是要用程式创造小说,后来因为复杂度较高,且要维持故事情节一致性较为困难,转而让程式自动写新诗,并加入图片的想法,让系统输入一张图片时,可以自动产生与图片主题相关的新诗。

他们收集了519为诗人的作品,高达9万行的诗句作为资料集,先用电脑视觉技术将图片撷取出多个物件,找出相对应的关键字,再利用以诗句常出现的关键词集滤器出诗句常见的词汇,以这些词汇做延伸,创造出4句的新诗,系统自动产生出来的诗,首先由他们内部人工判断句子的流畅度,等系统较稳定后,再请专业的诗人评分,这项研究得到微软小冰专案经理注视,在小冰的服务中限时开放6小时让使用者使用,得到广大回响。

另外,他们还将系统做的诗投稿多项比赛,最终获得北京晨报、信报和长江诗歌三大媒体刊登,他们也化名在各大文学论坛发表新诗,大多的人都反应写的很好,难以察觉是机器所写。

另一个有趣的应用是Seeing Bot,透过镜头的影像,可以即时显示画面的描述文字,像是一个人正在滑雪。开发团队收集一百万支影片,透过机器学习,能分析大约400多个动作,即时地自动产生对影片的描述。不过,目前还不能辨识性别。

2018-01-16 06:25:00

相关文章