GAN秒变肖像画清华刘永进提出APDrawingGAN CVPR Oral(附微信小程式)最新消息

整理编辑：三石

【新智元导读】自动地将人脸照片转换为高质量的艺术肖像画具有重要的艺术价值和实用价值。清华大学刘永进教授课题组对此提出APDrawingGAN，结果优于目前已有方法。该项工作被CVPR 2019录取为oral paper。本文还提供微信小程式，供读者尝试。肖像画是一种独特的艺术形式，通常使用一组稀疏的连续图形元素如线条来捕捉一个人的外表特征。

肖像画通常是在人物面前或基于人物照片进行创作的，其创作依赖于细致的观察、分析和丰富的经验。一幅好的肖像画能很好地捕捉到人的个性和情感。

图1. 一些人脸照片和对应的艺术家画的肖像线条画。

然而，即使是受过专业训练的艺术家，完成一幅精致的肖像画也需要很长时间。因此，自动地将人脸照片转换为高质量的艺术肖像画具有重要的艺术价值和实用价值。

清华刘永进组提出APDrawing GAN

随着深度学习的发展，使用卷积神经网络进行影象风格转换的神经风格转换（NST）方法被提出。随后，基于生成对抗网络（GAN）的方法在影象风格转换上实现了很好的效果。

但是，这些已有方法多数针对于生成资讯较为丰富的风格，如油画，这些风格的影象中包含很多零碎的图形元素（如笔触），而对单个元素的质量要求较低。也就是说，在这些风格的影象中，一些细节上的瑕疵会被忽视。

艺术肖像线条画(Artistic Portrait Drawings，简称APDrawings)和已有工作研究的油画肖像的风格有很大的不同。它主要有5个特点：

首先它是高度抽象的，只由少数稀疏、连续的图形元素组成，因此瑕疵会比油画中更明显。

其次是具有强限制性，由于包含面部特征，APDrawings相比一般的风格有更强的语义限制（因为我们对人脸很熟悉，会对人脸影象中的瑕疵容忍度更低）。

具有多样性，因为对于不同的面部特征，艺术家绘制的方式是不同的（如眼睛和头发）。

艺术创作的模糊性，人工创作导致了一些面部特征的轮廓没法被完全精准的定位，这对基于画素对应的方法是个很大的挑战。

APDrawings的概念性，艺术家有时会在原图没有亮度变化的地方新增额外的概念性的线条，比如头发区域中的白线和五官的轮廓线。因此，即使是顶尖的方法也难以产生好的艺术肖像画结果。

APDrawingGAN和一般P图、抠图、滤镜等工具的不同在于，一般的软件对真实照片进行美化得到更美观或具有某种特点的真实照片，而APDrawingGAN生成的是非真实感的抽象艺术肖像画，既能捕捉到照片特征又和真实照片观感完全不同。并且我们生成的线条风格的艺术肖像画比一般的肖像画（如卡通、铅笔素描）具有更少的图形元素，更抽象，因此也更有难度。下图展示了我们方法和一般影象处理工具的结果对比。

图2. 我们的方法和一般影象处理工具的处理结果的对比。人脸照片来源于免费版权图片网站Pixabay。

在CVPR2019上，清华大学计算机系刘永进教授课题组提出了APDrawingGAN，为了更有效地学习不同面部区域的不同绘制风格，我们的GAN模型包括几个专门针对不同面部特征区域的区域性网络，和一个用于捕捉整体特征的全域性网络。

论文地址：

APDrawingGAN的主要贡献在于：

我们提出了一个层次化的GAN模型，可以有效地将人脸照片生成高质量、富有表现力的艺术肖像线条画。不仅如此，我们的方法对黑白线条分明的复杂发型绘制有更好的效果。

为了学习不同面部区域的不同绘制风格，我们的模型将GAN的渲染输出分为不同层次，每个层次被独立的损失项控制。我们提出了一个针对艺术肖像画的损失函式，它包含四个损失项：对抗损失、画素级损失、一种新的距离变换（DT）损失（用于学习艺术肖像画中的线条笔画）和一个区域性变换损失（用于引导区域性网络保持面部特征）。

我们使用6655张人脸照片和非真实感渲染算法生成的结果进行了预训练，构建了一个包含140对高质量正面人脸照片和对应艺术肖像画的APDrawings资料集，用于正式的训练和测试。