APP下载

GeForceGTX10系列提速技术全面睇

消息来源:baojiabao.com 作者: 发布时间:2026-05-12

报价宝综合消息GeForceGTX10系列提速技术全面睇

GTX 1080 是首款应用新一代 Pascal 架构的显卡,采用先进的 16nm FinFET 制程生产,能源效率是上代 28nm 制程 Maxwell 架构的三倍以上。

Pascal 架构可视为 Maxwell 的升级版,并非重大改动的全新架构,由 GTX 1080 的 GP104 核心架构图可见,整体布局与 Maxwell GM204 类似,整个核心由 4 组 GPC(Graphics Processing Clusters)组成,共用的 L2 Cache 容量维持于 2MB 。 GP104 的内存控制器由 4 组 64-bit 改为 8 组 32-bit ,合共则为 256-bit ,与 GTX 980 相同。

GP104 核心架构图,由 4 组 GPC 组成,内存控 制器则分为 8 组。

GP104 核心架构图,由 4 组 GPC 组成,内存控制器则分为 8 组。

每组 GPC 由 5 组 TPC 组成,但所谓的 TPC 其实与上代的 SMM 功能一致, TPC 正是 SM 加上 PolyMorph Engine 而成,后者已升级至第四代,下文将另作介绍;而每组 SM 是由 128 个 CUDA 核心及 8 组 TU 等组成,与 Maxwell 没有分别。由于每组 GPC 变成 5 组 TPC ( Maxwell 为 4 组 SMM ),每组 GPC 的 CUDA 核心增至 640 个, TU 亦增至 40 个,所以 GTX 1080 正正提供 2,560 个 CUDA 核心与 160 个 TU ,比 GTX980 多出五分之一。

Pascal 架构可以轻易达到极高运作时脉, GTX 1080 的预设核心时脉已达 1,607MHz , Boost 更可达 1,733MHz ,远高于各款 Maxwell 型号,而且 GPU Boost 3.0 技术将 Frequency Offset 由固定改为根据电压点实时调节,可以更迅速提升时脉。 GTX 1080 之浮点运算能力更是惊人,官方数字高达 9 TFLOPS ,比上代 GTX Titan X ( 6.1 TFLOPS )或 GTX 980 Ti ( 5.6 TFLOPS )都要高出一大截。

GPU Boost 进化至第三代,可自动提升至更贴近理论最高时脉。

GPU Boost 进化至第三代,可自动提升至更贴近理论最高时脉。

技术提升 1:首度搭载 GDDR5X 内存

GTX 1080 的亮点是首度搭载 GDDR5X 内存( 1070/1060 为 GDDR5),配合新设计的 GPU 内部及基板 IO 线路,成功将运作时脉提升至 10Gbps ,比主流 GDDR5 的 7Gbps 高出四成以上,因此 GTX 1080 的理论带宽高达 320GB/s 。

Delta Color 压缩技术进化至第四代,新增 4:1 及 8:1 两级更高的压缩比例。

Delta Color 压缩技术进化至第四代,新增 4:1 及 8:1 两级更高的压缩比例。

与此同时, Pascal 架构的 Delta Color 内存压缩技术进一步强化,新增 4:1 及 8:1 压缩支援,节省要传输的材质。 NVIDIA 指出,受惠于 GDDR5X 带来的 1.4X 带宽,以及新压缩技术的 1.2X 效率, Pascal 的有效带宽足足是 Maxwell 的 1.7X 。

以 Project Cars 游戏为例,洋红色代表画面中可被压缩的部分,可见 Pascal 可以压缩画面绝大部分内容。

1191PAS24p11
1191PAS24p12

以 Project Cars 游戏为例,洋红色代表画面中可被压缩的部分,可见 Pascal 可以压缩画面绝大部分内容。

技术提升 2:全面提升运算效率

Pascal 架构的 GTX 1080 加入多方面的新技术,务求全面提升效能。首先是 Async Compute 方面的优化,现今 GPU 除了应付游戏之外,亦要身兼音效处理、Physics,以至 GPGPU 等不同类型的运算工作,而且不同运算工作往往需要同时处理,Pascal 引入 DynamicLoad Balancing,有效调配 GPU 资源,避免闲置资源影响效率。

动态调配 GPU 运算资源处理 Graphics 或 Compute 工作,避免闲置而影响效率。

动态调配 GPU 运算资源处理 Graphics 或 Compute 工作,避免闲置而影响效率。

此外,Pascal 更将 Graphics Preemption 优化到 Pixel Level,例如渲染一个三角形材质时,渲染工作可以在当前的像素即时中止,将有关 SM 单元转移到其他运算工作,厂方称切换过程可于 100μs 之内完成。在运算工作中,Pascal 可支援 Thread Level之Compute Preemption,运行 CUDA 程式时甚至可精细到 Instruction Level,亦即是指令码的程度,全面提升运算效率。

NVIDIA 官方数字称 GTX 1080 受益于制程及架构,游 戏效能是 GTX 980 的 1.7X, VR 效能更达到 2.7X。

NVIDIA 官方数字称 GTX 1080 受益于制程及架构,游戏效能是 GTX 980 的 1.7X,VR 效能更达到 2.7X。

技术提升 3:加入 HDR 支援

HDR 势将成为显示技术的下一个突破点,可望大幅提升可视色彩数目、色域、亮度以至对比度等,GTX 1080 的 HDR 支援已经相当全面,继承 Maxwell 本身对应之 12-bit 色彩、BT.2020 色域之外,更加入 HDR HEVC 影片之 4K@60Hz 解码(对应 10-bit 或 12-bit)及编码(对应 10-bit)支援,并且对应 HDMI 2.0b 与 DP 1.4 两大支援 HDR 之输出界面。

NVIDIA 表示正与游戏开发商积极合作,提供适合 HDR 之 API 及驱动程式支援,期望更多游戏支援 HDR,即将加入支援的作品包括 Rise of the Tomb Raider、The Witness、Obduction、Paragon、Lawbreakers 等。

虽然 HDR 在电脑应用仍在初步阶段,Pascal 已率先加入全面支援。

虽然 HDR 在电脑应用仍在初步阶段,Pascal 已率先加入全面支援。

技术提升 4:硬件解码、编码引擎再升级

GTX 1080 的硬件解码、编码引擎进一步升级。先是解码方面, H.264 格式可支援至 4K@120Hz 、 最高 240Mbps 之影片, HEVC 与 VP9 同样支援至 4K@120Hz 、最高 320Mbps 影片, HEVC 更率先对应 8K@30Hz 分辨率,数字上超前目前摄影装备之水平。编码方面, H.264 与 HEVC 两种格式均支援两组 4K@60Hz ,上文提到的 HDR 支援就不再重复了。显示输出方面, Maxwell 已对应 5K ( 5,120×3,200 )输出, Pascal 更提升至 7,680×4,320 水平, 需要用到两组 DP 1.3 界面才可达成。

GTX 980(Maxwell)与 GTX 1080(Pascal)的解码、编码支援比较表。

GTX 980(Maxwell)与 GTX 1080(Pascal)的解码、编码支援比较表。

技术提升 5:Ansel 游戏拍摄神器

NVIDIA 今次亦带来全新的 Ansel 游戏撷取工具,将游戏由撷图提升至拍摄的层次,皆因 Ansel 可以将游戏暂停,让用家自由移动视角(例如改变高度、方向等),以 Free Camera 拍摄游戏画面,更支援 360 度全景相片、加入各式滤镜以至 EXR 曝光等玩法。Ansel 的另一绝技是 Super Resolution,可以拍摄出屏幕分辨率的 32 倍的相片,方法是将屏幕分割成多个范围并进行快速撷取,然后再运用 CUDA 进行 Stitching 合并成超高分辨率的单一相片, 制作品最高分辨率达 4.5Gigapixel,档案大小高达 1.5GB!

画面左方是 Ansel 的 Overlay控制界面,用家可自由控制拍摄角度、分辨率及特效。

画面左方是 Ansel 的 Overlay控制界面,用家可自由控制拍摄角度、分辨率及特效。

技术提升 6:全面优化 VR

Pascal PolyMorph Engine 升级至第四代,主打是新增的 Simultaneous Multi-Projection 引擎。这个同步多重投影功能的原理,是使用单一 Geometry Stream 进行多个视角的运算,最多支援 16 个预设的视角。由于该引擎设于 TPC 内及整个 SM 之前,可以将原本多次的渲染工作,变成只需单一运算流程即可完成,大幅提升效率。

Simultaneous Multi-Projection 可以大幅节省运算资源,以 Oculus Rift 为例,要处理的像素由 4.2MP 大降至 2.8MP。

Simultaneous Multi-Projection 可以大幅节省运算资源,以 Oculus Rift 为例,要处理的像素由 4.2MP 大降至 2.8MP。

此功能更对应 Single Pass Stereo,顾名思义是同时支援两个独立的主视点(Projection Centers),一次过完成运算。将上述技术应用在 VR 装置中,就可以运算出 VR 左右画面的不同轴向,在单一一次运算中完成左右两个画面的渲染工作,从而节省运算资源。

图为 VR 的模拟投影方式示 意图,原本需要进行左右画面两次渲染,配合 Single Pass Stereo 就可以一次过完成,节省一半运算资源。

图为 VR 的模拟投影方式示意图,原本需要进行左右画面两次渲染,配合 Single Pass Stereo 就可以一次过完成,节省一半运算资源。

Lens Matched Shading 则是模拟出 VR 镜片的光学弧度及变形情况,亦即是用家实际所见到的画面范围,才渲染出实际可见的画面,大幅减少要处理的像素数目。再结合原有之 Multi-Resolution 技术,即是以较高分辨率渲染画面中央焦点部分、周围背景则以较低分辨率渲染,Pascal 的 VR 效能得以大幅提升。

1191PAS24p27
1191PAS24p28

由这个 VR Demo 可见,启用 Simultaneous Multi-Projection 后,FPS 即时由 50-60FPS 大增至90-100FPS。

2017-12-27 21:50:00

相关文章