报价宝 > 资讯 >

2D 图片变 3D：最新 3D GAN 可生成三维几何数据，模型速度提升 7 倍

消息来源:baojiabao.com 作者: 发布时间：2024-11-01

报价宝综合消息2D 图片变 3D：最新 3D GAN 可生成三维几何数据，模型速度提升 7 倍

2D 图片变 3D，还能给出 3D 几何数据？

英伟达和斯坦福大学联合推出的这个 GAN，真是刷新了 3D GAN 的新高度。

而且生成画质也更高，视角随便摇，面部都没有变形。

与过去传统的方法相比，它在速度上能快出 7 倍，而占用的内存却不到其十六分之一。

最厉害的莫过于还可给出 3D 几何数据，像这些石像效果，就是根据提取的位置信息再渲染而得到的。

甚至还能实时交互编辑。

该框架一经发布，就在推特上吸引了大量网友围观，点赞量高达 600+。

怎么样？是不是再次刷新你对 2D 升 3D 的想象了？

显隐混合 + 双重鉴别

事实上，只用一张单视角 2D 照片生成 3D 效果，此前已经有许多模型框架可以实现。

但是它们要么需要计算量非常大，要么给出的近似值与真正的 3D 效果不一致。

这就导致生成的效果会出现画质低、变形等问题。

为了解决以上的问题，研究人员提出了一种显隐混合神经网络架构（hybrid explicit-implicit network architecture）。

这种方法可以绕过计算上的限制，还能不过分依赖对图像的上采样。

从对比中可以看出，纯隐式神经网络（如 NeRF）使用带有位置编码（PE）的完全连接层（FC）来表示场景，会导致确定位置的速度很慢。

纯显式神经网络或混合了小型隐式解码器的框架，虽然速度更快，但是却不能保证高分辨率的输出效果。

而英伟达和斯坦福大学提出的这个新方法 EG3D，就将显式和隐式的表示优点结合在了一起。

它主要包括一个以 StyleGAN2 为基础的特征生成器和映射网络，一个轻量级的特征解码器，一个神经渲染模块、一个超分辨率模块和一个可以双重识别位置的 StyleGAN2 鉴别器。

其中，神经网络的主干为显式表示，它能够输出 3D 坐标；解码器部分则为隐式表示。

与典型的多层感知机制相比，该方法在速度上可快出 7 倍，而占用的内存却不到其十六分之一。

与此同时，该方法还继承了 StyleGAN2 的特性，比如效果良好的隐空间（latent space）。

比如，在数据集 FFHQ 中插值后，EG3D 的表现非常 nice：

该方法使用中等分辨率（128 x 128）进行渲染，再用 2D 图像空间卷积来提高最终输出的分辨率和图像质量。

这种双重鉴别，可以确保最终输出图像和渲染输出的一致性，从而避免在不同视图下由于卷积层不一致而产生的问题。

▲ 两图中左半边为最终输出效果，右半边为渲染输出

而没有使用双重鉴别的方法，在嘴角这种细节上就会出现一些扭曲。

▲ 左图未使用双重鉴别；右图为 EG3D 方法效果

数据上，与此前方法对比，EG3D 方法在 256 分辨率、512 分辨率下的距离得分（FID）、识别一致性（ID）、深度准确性和姿态准确性上，表现都更好。

团队介绍

此项研究由英伟达和斯坦福大学共同完成。

共同一作共有 4 位，分别是：Eric R. Chan、Connor Z. Lin、Matthew A. Chan、Koki Nagano。

其中，Eric R. Chan 是斯坦福大学的一位博士研究生，此前曾参与过一些 2D 图像变 3D 的方法，比如 pi-GAN。

Connor Z. Lin 是斯坦福大学的一位正在读博二的研究生，本科和硕士均就读于卡内基梅隆大学，研究方向为计算机图形学、深度学习等。

Matthew A. Chan 则是一位研究助理，以上三人均来自斯坦福大学计算机成像实验室（Computational Imaging Lab）。

Koki Nagano 目前就职于英伟达，担任高级研究员，研究方向为计算机图形学，本科毕业于东京大学。

论文地址：

https://arxiv.org/abs/2112.07945

参考链接：

https://matthew-a-chan.github.io/EG3D/

2022-05-08 05:43:44

文章标签: 报价宝降噪耳机价格耳机价格红米手机价格华为手机价格小米手机价格电视机价格笔记本电脑价格笔记本价格汽车价格手机价格汽车价格华为手机价格红米手机价格降噪耳机价格

淘宝天猫仅退款属于诈骗吗？淘宝天猫开始部分取消仅退款
2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰
2024-10-01 11:22:38
白嫖党｜山西大同大学学生网购申请“仅退款”被拒骂客服一小时
2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书阿里巴巴竞赛受质疑
2024-06-28 10:07:40
天猫新规可以无条件申请“仅退款”了？淘宝天猫又离狗多多零元购近了一步
2024-06-28 09:27:13
美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
小米汽车传员工3700人雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
国家新闻出版署:认真研究《网络游戏管理办法(草桉徵求意见稿)》关切实行前进一步完善
2023-12-28 19:14:56
印度以打击金融犯罪为由逮捕了两名 vivo 高管
2023-12-26 16:49:01
在国外微信收不到国内信息？微信和WeChat将被拆分
2023-12-15 10:40:15
苹果iPhone15 系列手机发布最新消息预计上市发布时间9月
2023-08-06 23:21:02
华为将发布鸿蒙HarmonyOS4操作系统功能五大升级支持设备清单
2023-08-06 23:17:37
整治自媒体网红账号 400万粉丝网红发布擦边视频被无限期封禁
2023-07-12 09:56:09
网传微信文件传输助手是真人是真的吗?微信官方回应
2023-06-27 15:53:32
电信移动送手机成了“信用购”？你上了运营商的贷款套路了吗？
2023-06-12 17:18:55
中国电信广东地区崩了无信号客服回应已在核实处理
2023-06-08 15:39:04
消息称小米新能源汽车价格表正讨论定价区间：双版本不同配置，高配或超 35 万元
2023-03-06 12:56:03
华为因制裁被传或分拆剥离手机业务? 内部人士回应:可能性不大.
2023-03-05 23:26:41
OPPO正式发布安第斯智能云，让终端更智能
2023-02-24 16:02:27
华为与OPPO签订全球专利交叉许可协议包括5G蜂窝通信专利
2023-02-24 16:02:26

2D 图片变 3D：最新 3D GAN 可生成三维几何数据，模型速度提升 7 倍

显隐混合 + 双重鉴别

团队介绍

品牌选车