演讲题目:《创作,拒绝等待——Nvidia Maximus 世界最强大的视觉超级计算平》

主讲嘉宾:NVIDIA高级系统架构师 刘明达

工程师、设计师以及专业的内容制作人士所面临的难题是,需要不断寻找新方法来更快地探索和证实更多理念。 通常涉及到的内容制作既需要视觉设计又需要物理模拟。 例如,设计一款汽车或制作一个数字电影人物、了解空气如何流经汽车或人物服装在动作场景中如何运动。不幸的是,设计与模拟过程通常是脱节的,两种过程发生在不同的系统上或发生在不同的时间。英伟达 MAXIMUS技术--基于英伟达 Maximus 技术的工作站在一台工作站中将英伟达 Quadro GPU 的可视化和互动设计功能与英伟达 Tesla GPU 的高性能计算能力集于一身。 英伟达 Tesla 协处理器可自动执行繁重的超逼真渲染任务或工程模拟计算。 如此一来,CPU 资源便能够从中解放出来,以便处理那些最适合由 CPU 来执行的工作,例如输入/输出、运行操作系统以及多任务处理。另外这种工作站还让英伟达 Quadro GPU 能够专门负责处理丰富的 全性能互动设计。 设计师和工程师现在能够在处理设计工作的同一台系统上同时执行 CAE、渲染或结构/流体分析。 专业的内容制作人士可以更快地执行视频编辑、特效以及动画的操作。

BIRTV2012:创作,拒绝等待-Nvidia Maximus「刘明达/NVIDIA」-讲座

BIRTV 2012:NVIDIA Maximus——拒绝等待,GPU加速开启视觉计算新时代

在BIRTV 2012“创作,拒绝等待”专题论坛上,NVIDIA高级系统架构师刘明达系统介绍了NVIDIA Maximus技术及GPU加速在影视特效、渲染、非线性编辑等领域的革命性应用。通过Quadro专业显卡与Tesla计算卡的协同工作,设计师可以实时预览粒子模拟、光追渲染及多层视频编辑,将数小时的等待压缩至分钟级,彻底改变传统工作流程。

从游戏显卡到专业计算:NVIDIA的四条产品线

刘明达首先介绍了NVIDIA公司的整体布局。这家成立于1992年的硅谷企业,如今在全球拥有7000名员工,CEO黄仁勋是华人。NVIDIA不仅提供传统的PC显卡,其芯片已广泛应用于平板、手机乃至超级计算机。产品线分为四类:移动处理器(Tegra系列,用于平板和手机)、消费级游戏显卡(GeForce品牌,中国网吧市场份额超90%)、通用计算加速卡(Tesla品牌,全球Top500超算前五名中有三台使用Tesla加速),以及今天重点讲述的Quadro专业显卡——面向行业用户,所有主流独立软件开发商(ISV)均100%推荐与Quadro配合使用。刘明达强调,NVIDIA约60%至70%的员工从事软件研发,正是背后大量的中间层驱动和专用特性(如10bit灰阶、SDI输入输出、多屏同步等),使得专业显卡在稳定性、兼容性和功能上远超游戏卡。

Maximus技术:Quadro与Tesla联手,图形与计算并行

Maximus是NVIDIA推出的一项突破性技术。它让一台工作站同时搭载一片Quadro专业显卡(负责图形界面与实时交互)和一片Tesla计算卡(负责大规模并行计算)。对于影视特效行业,这意味着流体模拟、粒子系统、毛发运算等传统上由CPU承担、耗时极长的任务,可以无缝迁移到GPU上。由于这些计算具有“单一属性、大量并行”的特点,GPU的硬件架构天生适合此类工作。通过CUDA语言,软件厂商可以将相应的运算移植到GPU上。驱动层会自动将图形API和计算API分配给不同的处理器,用户只需额外插入Tesla卡,即可将支持的软件加速起来。

现场演示了Maya中的粒子仿真对比:传统的CPU粒子(约8000个)运行卡顿,无法实时交互;而开启GPU加速后,同一场景中可以实时观察离子碰撞、流动,甚至通过高度贴图引导粒子运动形成图案。设计师不再需要等待数小时才能看到模拟结果,完全可以“一边设计,一边看效果”,与导演实时沟通调整,大幅提升创作效率。

渲染革命:实时光线追踪,所见即所得

刘明达澄清了一个常见误区:传统最终渲染由CPU完成,显卡再强也无法加速。但在CUDA和Maximus方案下,渲染工作也可移至GPU。他引用了好莱坞案例:为完成《阿凡达》,NVIDIA派出团队与维塔工作室合作,编写了基于GPU加速的专属着色器“潘塔瑞”(Panther),才使得影片在档期内完成。《黑衣人3》中阿波罗火箭发射的全CG场景,其火焰与烟雾模拟同样依赖索尼内部开发的GPU加速着色器。

以V-Ray RT渲染器为例,选择CUDA加速后,用户可实时看到光线追踪的渐进式渲染效果——从麻点逐渐清晰,几分钟内即可达到接近最终输出的质量。且光线追踪算法对灯光设定要求极低,无需复杂参数调整,即能渲染出逼真场景。同样,iray渲染器也基于GPU光线追踪,设计师可快速预览材质及灯光方向,等上一分钟就能获得高精度参考。这种“所见即所得”的快速真实预览,是传统硬件渲染无法比拟的。

非编与合成:GPU加速带来数倍性能提升

在非线性编辑领域,主流的Avid、Flame、Smoke、Media Composer等软件均已支持GPU加速,性能提升可达7至11倍。Adobe Premiere从5.0版本开始集成“水星引擎”(Mercury Playback Engine),利用GPU加速预览及输出编码。测试显示,即便是中低端Quadro 2000显卡,也比八核至强CPU快4至5倍。当视频层数超过三层后,CPU会变得几乎无法操作(例如10层1080p叠加后,鼠标移动响应需1-2分钟),而GPU可保证流畅编辑。After Effects CS6新增了3D功能,集成了OptiX光线追踪SDK,使合成师可以直接在AE内做简单3D操作并以光线追踪渲染,性能加速可达到10倍甚至20倍。

此外,达芬奇等专业调色软件也已采用GPU降噪及调色,NVIDIA展台上有四片Tesla卡驱动的实时演示。3ds Max从2011版集成iray,2013版支持Active Shader和运动模糊(motion blur),解决了以往GPU渲染器无法处理运动模糊的痛点。Maya中也加入了基于GPU的物理引擎,用于刚体模拟。

专业卡 vs 游戏卡:稳定性与认证的价值

针对现场观众关于“是否可用游戏卡替代”的疑问,刘明达明确建议:在资金允许的情况下,应选择专业显卡。专业卡在驱动层面与ISV软件厂商有联合认证和测试,即使使用盗版软件,游戏卡出现问题也无法获得支持。专业卡还提供游戏卡不具备的功能(如10bit输出、帧同步、SDI I/O等)。价格相近的情况下,Quadro 4000级别专业卡远比GeForce GTX 580更适合专业工作流。他举例:某参与奥运会数字制作的大型公司,一帧建筑渲染需4-5小时,在测试Maximus方案后,有望缩短至半小时以内。

结语:热爱与效率并行

刘明达最后表示,影视特效行业必然伴随加班,但对CG的热爱是坚持的动力。Maximus技术让设计师从“等待计算”中解放出来,将精力真正投入到创作中。更多性能测试、案例视频及软件兼容列表,可访问NVIDIA官网行业解决方案专区。他强调:“做我们这行,一定要有真的热爱的情怀在里面,否则你会觉得非常辛苦。”

讲座视频

[~以下为收费内容~]