英伟达 AI 模型可实时用文字 P 图:输入单词或短语,可立刻输出逼真的照片(附在线 Demo,可试玩)
消息来源:baojiabao.com 作者: 发布时间:2026-05-26
在"一句话生成照片"这件事上,英伟达又一次突破了大伙的想象力。
他们最新的 AI 模型 GauGAN2,不仅能根据字词生成逼真风景照,还能实时用文字 P 图。
输入一句"海浪击打岸边石",立刻输出一张逼真照片:
从单词到短语,这只 AI 全都能 get!
那感觉,简直是要山得山,要水得水:
要是觉得哪部分你不喜欢,直接打字就能"P 图":
上面这些效果,都是英伟达这个叫做"GauGAN2"的模型做出来的,而它的"完整版"功能,还远不止这些。
从草图到文字,都能生成风景照
GauGAN2 的绘制模式,一共分为三种。
第一种,打字生成图片。
我们先试了一下单个词组,"阳光(sunshine)",生成如下图片:
加上限定词 in the forest 后,AI 立刻就将场景换到了树林里,变成光洒在树林中的场景:
再多来点限定词也没问题。
像"冬日树林中的阳光",输入 in winter 后,眼前本来郁郁葱葱的树林立刻"全秃了",换成了雪景下的一幕:
这效果,u1s1(有一说一)确实不错。
还能输出不同 style 的风景图,例如输入"大山(mountain)"一词,立刻要山有山,还能给你换不同风格:
当然,这些不同的风景照也都能继续生成新细节,在 mountain 后加上"beside a river"就能生成山水:
第二种,"打字 P 图",直接用文字编辑部分图像。
只需要把想替换掉的部分圈出来,输入你想要的东西,就能立刻造出各种新颖的风景图:
嗯…… 英伟达给出的这个 demo,思路也是非常清奇了,"浮在空中的城堡":
第三种,用涂鸦生成风景照。
这是上一代 GauGAN2(2019 年英伟达推出的 GauGAN)的看家本领。
例如,要是想实现下面这样的"一片天空两个太阳",就完全可以在通过文本生成的图像上,自己手动再加一个。
这几种玩法叠加在一起,简直让网友们脑洞大开。
像外媒 ZDNet 就恶搞出来了一种神奇的玩法,在已有的风景上画个人头:
然后让 GauGAN2 根据已有的画面,再重新生成图画,就会得到如下"人头海岛"的神奇景观:
不过这可能也对个人画技有所要求,在我们的灵魂画风下,效果看上去就有些…… 不太聪明的亚子。
那么,生成这一系列风景照的 GauGAN2,背后究竟用了什么原理?
它与 OpenAI 今年发布的 DALL・E 和 CLIP,又究竟有什么区别?
与 DALL・E 有什么不同?
2019 年,英伟达 GauGAN2 的"前身"GauGAN 正式开源。
当时的它,还只拥有其中一个能力,就是将涂鸦直接变成风景画,就像「神笔马良」一样,还推出了对应的软件 Canvas:
当然,这时 GauGAN 已经能随意改变画面风格了,从白天黑夜到春夏秋冬的气质都能稳稳"拿捏":
据英伟达介绍,GauGAN 采用了一种基于空间适应标准化(SPADE)算法。
SPADE 算法不仅使用随机的输入图像,还采用了一种被称作"分割图"的图像。在分割图中,每一个像素都会被归类,来生成更接近于真实的图像,这种模式被称作"图对图翻译"。
▲ GauGAN 的技能点(狗头)
现在,英伟达将 GauGAN 升级成了 GauGAN2,后者一共采用了 1000 万张高质量的图片、在英伟达 Selene 超算上进行训练,这台超算在 Green500 排行榜上排到世界第二。
生成这些风景画的效果和"手法",是不是感觉有点熟悉?
没错,大多数人看到 GauGAN2 的第一眼,可能都会觉得它和 OpenAI 的 DALL・E+CLIP 有点像。
今年年初,OpenAI 用 DALL・E 和 CLIP 两个模型,做了个"图像版"GPT-3,同样能用一句话生成图片。
不过,这两个模型生成的内容其实不太一样。
GauGAN2 专注于生成风景照,DALL・E+CLIP 则更多地生成具体的物体,例如一把椅子或者一个闹钟等。
这与它们的原理差异也有关系,GauGAN2 更加注重"单词与视觉效果"之间的关系,例如"冬天"这种模糊的状态词给照片带来的效果;DALL・E+CLIP 则更注重"文字-图像"这种有明确对应关系的物体效果。
据英伟达介绍,GauGAN2 不同于"文本-图像"和"分割图像-图像"一类的模型,它所能产生的照片种类更多,质量也会更高。
不过,偶尔也会出现点 bug…
比如给出"沙滩(beach)"一词后,有些生成的画面中出现了语言无法描述的事物。
对此,英伟达表示,他们在训练中"完全没有用到任何人像照片"。(所以可能是偶然?)
但这样一来,网友想要的"瑞克摇(Rick roll)"和"鬼畜视频生成",GauGAN2 大概也是没办法实现了。
但是能生成仿佛梦境中才能见到的画面,也吸引了不少人来试玩。
这不,有人就晒出了自己生成的抽象画大作,并表示自己非常喜欢这个模型:
还有人表示,GauGAN2 给出了一些建筑设计的新 idea 啊。
也有网友觉得这种能够自动生成景观的功能,未来 Adobe 可能也会用上。
或许就是下一个画手利器?
最后,GauGAN2 在浏览器上就能试玩,欢迎大家留言讨论自己的体验感受。
GauGAN2 试玩 Demo 地址:点此直达
2022-05-08 04:56:51相关文章
炒港股要补交多少税?我也接到催交补税特别行动的电话了2025-07-23 17:36:43
淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步2024-06-28 09:27:13
美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
国家新闻出版署:认真研究《网络游戏管理办法(草桉徵求意见稿)》关切 实行前进一步完善2023-12-28 19:14:56
印度以打击金融犯罪为由逮捕了两名 vivo 高管2023-12-26 16:49:01
在国外微信收不到国内信息?微信和WeChat将被拆分2023-12-15 10:40:15
苹果iPhone15 系列手机发布最新消息 预计上市发布时间9月2023-08-06 23:21:02
华为将发布鸿蒙HarmonyOS4操作系统 功能五大升级支持设备清单2023-08-06 23:17:37
整治自媒体网红账号 400万粉丝网红发布擦边视频被无限期封禁2023-07-12 09:56:09
网传微信文件传输助手是真人是真的吗?微信官方回应2023-06-27 15:53:32
电信移动送手机成了“信用购”?你上了运营商的贷款套路了吗?2023-06-12 17:18:55
中国电信广东地区崩了无信号 客服回应已在核实处理2023-06-08 15:39:04
消息称小米新能源汽车价格表正讨论定价区间:双版本不同配置,高配或超 35 万元2023-03-06 12:56:03
华为因制裁被传或分拆剥离手机业务? 内部人士回应:可能性不大.2023-03-05 23:26:41
OPPO正式发布安第斯智能云,让终端更智能2023-02-24 16:02:27














