训练这样的算法需要耗费大量的时间和处理能力,不过在资料中心完成任务后就可以在低功耗的行动装置上运行,并且不费事,繁重的工作已经完成,因此一旦你的照片上传到云端,Google就可以用自己的模型来分析和标记图库,Google Photos发布约一年后,苹果公司宣布了一项在神经网络上接受过类似训练的照片搜寻功能,但作为公司对隐私承诺的一部分,实际分类在每个设备的处理器上单独进行,不需要传送资料,而这通常需要一两天时间在设置好的后台进行。
2.“运算摄影”成为新主流
智慧照片管理软件是一回儿事,但首先要说的是人工智能和机器学习对图像的捕获方式产生了更大的影响,毫无疑问,镜头会继续变快,感光元件也总能变大一点,但涉及将光学系统塞进轻薄的行动装置,我们已经快接近物理限制,尽管如此,现在的手机在某些情况下能拍出比许多专业相机设备更好的照片。渐渐地传统相机无法与同样配备高级摄影SoC的系统竞争,其包括一个中央处理器、一个图像讯号处理器,以及一个越来越多的神经处理单元(NPU)。
“运算摄影”成了一个新的名词,这是一个广义的术语,譬如手机肖像模式的假景深效果,以及有助于提升Google Pixel图像品质的算法,并非所有运算摄影都涉及人工智能,但人工智能必定是其中一个重要组成部分。

3.双镜头与AI算法
苹果在运算摄影技术上最主要的发展就是其手机的双镜头肖像模式,苹果手机的图像讯号处理器依靠机器学习,透过一个镜头辨识人像,另一个镜头创建深度图以分离拍摄主体和模糊背景,2016年此功能首次亮相时,透过机器学习辨识人像的技能并不是什么新鲜事,因为图片处理软件已经在做这个了,但以智能手机镜头所需的速度即时辨识则是一项重大突破。
然而,Google预设的拍摄模式HDR+使用了一种更复杂的算法,将几个曝光不足的影格合并为一个,正如Google运算摄影负责人马克·勒沃伊(Marc Levoy)所说,机器学习意味着系统只会随着时间越来越好。就像Google Photos,Google已经将其人工智能训练在一庞大的标签照片资料集上,进一步辅助相机曝光,尤其是Pixel 2产生的基线图像品质非常好,The Verge网站在专业工作中也会使用到,效果非常满意。
不过Google的优势从来没有像几个月前推出夜视系统那样突出,新版Pixel将长曝光缝合在一起,使用机器学习算法计算更精确的白平衡和颜色,坦白说,效果令人惊艳,因为算法的设计以最新的硬件为依托,该功能在Pixel 3上效果最好,不过Google为各种Pixel版本的手机都推出了夜视功能,即使是缺乏光学图像稳定性的原始图像也可以处理,这说明了软件在行动摄影领域比相机硬件更重要。
4.从图像讯号处理器进化到神经引擎
从上可知,硬件仍有进步的空间,特别是在人工智能的支援下。
据了解,华为和荣耀的新款手机第一个使用了索尼IMX586图像感应器,这是一个比多数竞争对手都大的感应器,有4800万像素,是目前任何手机上看到的最高分辨率,但这也意味着要在一个很小的空间里塞进许多微小的像素,图像品质往往会成问题。然而,在测试中荣耀的“人工智能超高分辨率”模式擅长最大限度地利用分辨率,去除感应器异常的滤镜,呈现额外的细节,这也会产生巨大的照片,放大看需要几日时间。

图像讯号处理器在一段时间内对手机相机的性能非常重要,但随着运算摄影技术的发展,NPU可能会发挥更大的作用,华为第一个宣布采取专用人工智能硬件SoC系统Kirin 970,尽管苹果的A11 Bionic最终率先到达了用户端,全球最大的Android处理器供应商高通公司尚未将机器学习作为主要的焦点,Google方面开发了自己的芯片,Pixel Visual Core,帮助完成与人工智能相关的成像任务。
与此同时,最新的苹果A12 Bionic配备8核的神经引擎,在苹果的机器学习框架Core ML中运行任务,比A11快九倍,并且实现首次直接连接到图像处理器。苹果公司表示,这能让相机更好地解析对焦平面,例如产生更真实的景深。
由于SoC对处理器的要求非常高,对于提高设备机器学习的效率和性能而言,它将越来越重要,别忘了,Google Photos的算法是在具有强大GPU和张量运算核心的电脑上训练,然后再放进照片库,可以说大部分工作都可以“提前”完成,不过在行动装置上即时进行机器学习计算的能力仍然是最尖端的科技。
Google已经展示了一些可以减轻处理负担的工作,令人印象深刻,神经引擎在这一年里也越来越快。即使是在运算摄影的早期阶段,围绕机器学习而设计的手机镜头也能带来真正的好处。事实上,过去几年人工智能炒作浪潮带来的所有可能性和应用中,今天运用最实际的领域可以说就是摄影。
相机是任何手机的基本功能,而人工智能是我们改进它的最佳手段。
- 资料来源:How AI is changing photography
- 本文授权转载自网易科技






























