APP下载

Google以AI协助纽时数字化逾500万张历史照片

消息来源:baojiabao.com 作者: 发布时间:2024-05-20

报价宝综合消息Google以AI协助纽时数字化逾500万张历史照片
图片来源: 

Google

纽约时报(The New York Times,纽时)上周宣布,将借由Google Cloud的AI技术将该报从创刊以来所拍摄的新闻照片数字化,把这些庞大的旧照片从不见天日的地下室移至云端,准备赋予这些照片新生命,并使它们能够被再利用。

从1851年创刊迄今,超过167年历史的纽时已拍摄了500~700万张照片,还有数以千万的历史新闻剪报、微缩胶卷纪录及其它档案资料,这些资料原本都存放在纽时特别设立的档案图书馆中,此一使用了地下三层楼的图书馆利用数百个档案柜来存放这些纸本资料。不难想见的是,绝大多数的资料都有好些年不曾见光。

纽时的助理总编辑Monica Drake表示,他们一直知道自己拥有庞大的历史照片,而现在,云端技术不仅让他们能够保存这些档案来源,还能够方便他们搜寻及找出旧照片,以提供更清楚的历史背景,最终将提供更多的工具予该报记者。

Google Cloud技术长Brian Stevens则说,Google将以Cloud Storage、Cloud Pub/Sub与Cloud Vision API来协助保存这些无价的历史纪录,允许记者可搜寻、存取与分析这些珍贵的照片,赋予它们全新的生命。

目前纽时正在数字化所有的馆藏,并将这些经过扫描的高分辨率影像存放在Google Cloud Storage上,再透过 Cloud Pub/Sub、 Google Kubernetes Engine、 Cloud SQL等云端技术来处理与储存这些影像,最后再利用Cloud Vision API以辨识及分析影像中的文字、手写内容或其它细节。

基于机器学习技术的Cloud Vision API还能辨识照片中的物件、地点及图像,并可借由Cloud Natural Language API 替这些文字描述添增额外的资讯,例如它能把提到宾州、华盛顿、迈阿密车站的资料分类至“旅游”中“公车与铁路”的子类别。

纽时利用Google Cloud建立了一个数字化资产管理系统,未来也将利用此一系统来撰写历史性的报导,包括探讨加州在20世纪的文化,以及介绍美国两大热门运动—冲浪及滑板的诞生纪事。

2018-11-12 18:12:00

相关文章