BIRTV2023秒懂训练营:AI绘画工具InvokeAI+ComfyUI

秒懂训练营:AI绘画工具InvokeAI+ComfyUI
8月24日 10:00

BIRTV2023秒懂训练营:AI绘画工具InvokeAI+ComfyUI

郭瑞
MXDIA乂媒体|负责人

郭瑞,植根影视制作行业20余年,创办TVtalk.cn中华电视包装论坛、MXDIA乂媒体创意社区,BIRTV影视制作专题讲座负责人,数字艺术展策展人。主持策划2019~2023《BIRTV影视制作专题讲座》、2016~2022《影视制作圈年度收入调查报告》,及多场数字艺术展。

BIRTV2023秒懂训练营:AI绘画工具InvokeAI+ComfyUI 

MXDIA乂媒体创意社区于2016年成立,下设社区网站和微信公众号等自媒体矩阵。8万注册会员,2万设计案例、150场专业讲座、致力于为创意产业提供优质行业交流服务。为动画设计、影视制作、广告传媒等领域设计精英、创意团队和企业用户提供在线交流和行业协作服务。

BIRTV2023秒懂训练营:AI绘画工具InvokeAI+ComfyUI

MXDIA郭瑞解析AI绘画工具InvokeAI与ComfyUI:从模型原理到节点控制

近日,在"秒懂训练营"行业分享活动中,MXDIA乂媒体负责人郭瑞系统解析了两款开源AI绘画工具InvokeAI与ComfyUI的核心特性与应用逻辑。作为Stable Diffusion生态中的重要分支,这两款工具分别从交互界面与节点工作流两个维度,为专业创作者提供了更可控、更灵活的AIGC生产方案。

Stable Diffusion生态分化:InvokeAI的独立路径

郭瑞首先梳理了当前主流AI绘画工具的格局。Stable Diffusion作为开源基础,因全球程序员持续贡献插件而拥有最广泛的社区支持;其激进分支VLAD则走独立发展路线。InvokeAI作为另一独立分支,采用Diffuser模型架构,区别于传统单文件模型(通常5GB至10GB以上),在模型加载与运算逻辑上提供了不同的技术路径。

面对硬件门槛,郭瑞指出SD XL大模型需20GB以上显存支持,现场展示的联想ThinkStation PX工作站(搭载双CPU与多块RTX A6000 ADA显卡)可本地运行,而普通用户亦可选择云端方案——通过IP地址直接访问部署在云端的InvokeAI界面,无需本地高配硬件即可体验完整功能。

XL模型革命:分辨率升级与双模型精修

郭瑞重点演示了SD XL模型的运算机制。与前代SD 1.5基于512×512图像训练不同,XL模型的训练集为1024×1024,因此生成时必须匹配对应尺寸,否则会出现肢体错位、画面拼接等异常。现场实验中,同一提示词在1024×1024下生成正常图像,而强制改为512×512后则输出失真结果,直观展示了模型与分辨率严格绑定的技术特性。

XL模型的另一突破在于引入Base模型与Refiner模型的双模型计算流程。Base模型负责基础生成,Refiner模型则承担精修功能——专门修复皮肤质感、发丝细节、眼部对称性及手指数量等前代模型常见问题。现场对比显示,经Refiner二次运算后的爱因斯坦肖像,面部褶皱与胡须细节明显更趋自然平滑,"将输出图像质量提升到前所未有的高度"。

ComfyUI节点编辑:把控制权交还创作者

相较于InvokeAI的常规界面,ComfyUI采用节点式工作流设计。郭瑞解释,传统UI规定了固定操作顺序,而节点工具允许创作者在符合运算逻辑的前提下,任意连接与控制每一个处理环节。"你可以在输出结果之前,对任意节点进行修改,精准控制运算流程。"

这种设计不仅提升了可控性,还实现了过程可视化。演示中,Base模型与Refiner模型作为独立节点并行展示,创作者可实时观察基础生成结果,再决定是否触发精修流程。郭瑞强调,Stable Diffusion WebUI、VLAD与ComfyUI三款工具的插件具有通用性,同一模型与扩展可在不同界面间迁移,降低了学习成本。

创作伦理:工具理性与主体性坚守

在展示技术效率的同时,郭瑞反复提醒创作者警惕"AI依赖症"。他指出,网络上展示的精美AI作品背后往往存在极高的失败率与筛选成本,"客户看到一张好图,背后是创作者失败了成千上万张"。若创作者仅停留在"输入想法、等待出图"的模式,放弃对生成过程的深度干预,则极易沦为"AI的奴隶"。

针对行业关注的版权问题,郭瑞预告将于后续专场深入探讨AI版权的多层法律维度。他认为,程序员之所以开发节点控制类工具,正是为了将创作主导权交还人类——"你的存在意义不是成为AI的附属,而是利用AI完成更高阶的艺术表达。"

活动最后,郭瑞建议从业者通过MXDIA视频号获取InvokeAI与ComfyUI的实操教程,并强调在AI技术日新月异的当下,"任何时间点进入AI领域都不晚,因为所有人都是同一起跑线上的小学生。"

[~以下为收费内容~]


演讲视频