APP下载

微软Azure影片索引器正式上线,新加入情绪侦测、语言辨识模型,自动判别讲者情绪及使用语言

消息来源:baojiabao.com 作者: 发布时间:2024-05-13

报价宝综合消息微软Azure影片索引器正式上线,新加入情绪侦测、语言辨识模型,自动判别讲者情绪及使用语言
图片来源: 

微软

自今年5月微软在公有云平台释出影片索引器(Video Indexer)后,近日该公司宣布,影片索引器服务正式上线。这款服务结合了人工智能,自动帮使用者分析影片中由话语、人脸、人物和表情,建立索引后提供使用者搜寻服务。同时,影片索引服务也能搭配迁入式套件,让开发者可以将该服务与其他应用程序整合。

微软表示,影片索引器搭配了数组机器学习模型,分别能处理声音、演说,以及视觉资料。而这一次正式上线后,微软新加入了数组机器学习模组。第一组机器学习模型可分析进行情绪侦测(emotion detection),结合影片中的演说情境以及语片,判定影音资料中的情绪内容,例如愤怒、恐惧、悲伤以及欢乐等。

情绪侦测功能也是这次影片索引器上线的新亮点,利用相异颜色划分情绪种类,在时间轴列出该影片中出现情绪的时间比例。图片来源:微软

第二组机器学习模型的功能,则是自动判定影片中使用的语言,未来使用者批次上传影片档时,不需要再手动标注,影片索引服务自动就能分析。目前微软能支援自动判定的语言,包含英语、法语、日语、葡萄牙语、西班牙文、中文等大宗语言。

再者,现在影片索引服务也变得更聪明,开始能辨别该影片的议题、内容。微软解释,此功能意即让系统根据影片中的演说内容、视觉提示(Visual cues)资讯,理解高层次的议题。在关键字撷取模型中,演说内容必须出现关键字,系统才能判定该演说的范畴。而微软表示,这个新模型可以根据演说内容,推论该议题的重点,“即便关键字未出现在其中。”

除了新增影片索引器内建的机器学习模型,该服务的既有功能也进行加强。例如影片索引器中名人辨识(celebrity recognition)模型,微软就利用外部资料来源,如大型电影数据库IMDb、维基百科、LinkedIn等,作为模型训练的素材。

影片索引服务上线后,内建的名人辨识功能也有加强。在上图示范中,影片上传至该分析工具,系统就辨识出微软首席执行官Satya Nadella的出现长度,总共占据17%。而在该使用界面,还可以直接搜索与该人相关的资料、简历。图片来源:微软

2018-09-14 18:31:00

相关文章