APP下载

AWS新服务大力拥抱AI,涵盖机器学习、即时影片分析、自然语言处理、翻译及AI摄影机

消息来源:baojiabao.com 作者: 发布时间:2024-04-25

报价宝综合消息AWS新服务大力拥抱AI,涵盖机器学习、即时影片分析、自然语言处理、翻译及AI摄影机
图片来源: 

Amazon

Amazon于本周三(11/29)展开的“Amazon Web Services re:Invent”云端运算年度社群大会上发表了一系列的人工智能(AI)服务及产品,从机器学习Amazon SageMaker自然语言处理Amazon Comprehend即时影片分析Amazon Rekognition Video即时翻译Amazon Translate语音转文字Amazon Transcribe,以及内建AI能力的视讯摄影机AWS DeepLens等。

 

创建大量机器学习Amazon SageMaker

其中,Amazon SageMaker是个端对端的机器学习服务,允许资料科学家、开发人员或机器学习专家能够快速地建置、训练与代管大规模的机器学习模型,它由3大元件组成,分别是可供创作的Jupyter notebook、分散式的模型训练,以及模型代管。(来源:Amazon)

使用者可先建立notebook实例,利用AWS的算法来追踪训练任务,建立模型,再将这些由AWS代管的模型部署于终端。

 

自然语言理解工具Amazon Comprehend

Amazon Comprehend为一自然语言处理服务,能够分析98种语言并辨识这些语言所指称的内容,像是人名、地点、品牌或产品等,也能理解语言中的关键句子与情绪,以于大量的文件或内容中依照主题加以建模或分类,该服务已于即日起上线。

 

大量影片内容管理的好帮手Amazon Rekognition Video

而Amazon Rekognition Video则为一影片分析服务,能够用来分析储存于S3上的大量影片,或是直播的串流影片。它与去年发表的Amazon Rekognition Image同样都利用深度学习神经网络模型来分析内容,只不过一个分析的是图像,一个则可分析即时影片。

Amazon Rekognition Video让使用者可精确地侦测、追踪、辨识与汲取影片中所出现的数千种物件或人脸,Amazon则强调它是全球首个可利用影片视觉、时间与动作脉络来执行行为侦测与个人追踪的影片分析服务,可提供更完整的影片解析能力,例如它能辨识影片中有个人、有辆车、有棵树,并推断那个人正往车辆跑去。

因此,未来不论是来自于手机、摄影机、IoT装置或串流服务的影片都可借由Amazon Rekognition Video来建立得以扩展且更精确的影片分析解决方案。

 

云端的即时翻译专家Amazon Translate

Amazon Translate为一即时的语言翻译服务(下图),现为预览版,它可并入其它的AWS服务,例如结合将文字转换成语音的Amazon Polly服务来建立不同语言的应用,或是于Amazon S3中翻译不同语言的文件,也能应用在AWS Elasticsearch中以不同语言进行搜寻,整合Amazon Lex以打造具备翻译能力的聊天机器人,AWS Lambda用户则能利用该服务来翻译动态的网站内容。

此一翻译服务将允许企业快速扩充产品及服务至不同的市场,或是转换文件的语言,并汲取全球语言的资讯。

 

将语音转为文字-Amazon Transcribe

至于Amazon Transcribe则是个自动语音辨识服务,能将语音转换成文字,同时允许开发人员将此一功能嵌入应用程序中。

Amazon认为,全球有愈来愈多的资料是以影片或语音格式储存,Amazon Transcribe允许企业将这些多媒体资料转换成方便利用的文字,它支援WAV、MP3及Flac等不同的语音格式,可用来分析储存于S3的语音档案,或是分析客户的通话资料、自动建立字幕、根据内容执行目标式广告,也能搜寻语音或影片内容。

目前的Amazon Transcribe API预览版可将英文或西班牙文的语音转换成文字。

 

具备AI的视讯摄影机-AWS DeepLens

AWS DeepLens(下图)是Amazon昨天发表的唯一一款硬件,它是个内建AI能力的视讯摄影机,搭载拥有100 GLOPS运算能力的Intel Atom处理器,400万画素的镜头可捕捉1080P的影片,并嵌有麦克风,每秒可执行数十张画面,具备Wi-Fi、USB及micro HDMI传输埠,内建8GB的内存空间以供用户预载模型与程式。

AWS DeepLens执行Ubuntu 16.04平台,也预载了Greengrass Core与MXNet。当中的Greengrass是个可将AWS云端能力延伸到区域装置的软件,MXNet则为开源的深度学习框架,亦支援TensorFlow与Caffe2等其他框架。

开发人员除了可自行打造在AWS DeepLens上的应用程序之外,也能借由AWS所提供的7种模型加强应用程序的能力(下图),涵盖行动辨识模型、猫/狗辨识模型、人脸侦测模型及物件侦测模型等,AWS亦承诺会持续强化模型训练,以创造更好的侦测与辨识能力。

AWS DeepLens可汇入于Amazon SageMaker中训练的模型,还能借由Amazon Kinesis Video Streams将影像串流回AWS,再利用Amazon Rekognition Video执行影像分析,同时也能连结其他的AWS服务。

AWS DeepLens即日起开放预购,售价为249美元,但得要等到明年4月才开始出货。

 

AWS“Amazon Web Services re:Invent”影片YouTube频道

2018-01-10 01:25:00

相关文章