GAMES Webinar 2024 – 361期(AIGC图像生成与编辑新进展) | 陈汐(香港大学),汪逸阳(香港大学),季思慧(香港大学)

【GAMES Webinar 2025-361期】(视觉专题-AIGC图像生成与编辑新进展)

报告嘉宾:陈汐(香港大学)

报告时间:2025年4月3号星期四晚上8:00-8:20(北京时间)

报告题目:UniReal: 从视频中学习统一的图像生成与编辑

报告摘要:

我们提出名为UniReal的图像编辑与生成统一范式,将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入输出图像建模为视频帧,从大规模真实视频数据中学习属性、姿态、光照等多种物理规律,从而实现高保真的生成效果。

讲者简介:

陈汐是香港大学计算机系三年级博士生,导师为赵恒爽教授。于此之前,本科硕士毕业于浙江大学,并且获得法国马赛中央理工双硕士学位。主要研究方向为图像视频生成与理解。在国际顶级会议期刊发表论文二十余篇(一作8篇),引用量1600余次,GitHub star 6,000余次,其研究成果入选CVPR最具影响力论文榜单。

讲者主页:https://xavierchen34.github.io/


报告嘉宾:汪逸阳(香港大学)

报告时间:2025年4月3号星期四晚上8:20-8:40(北京时间)

报告题目:DiffDoctor:“诊断”文生图模型的局部问题再加以“治疗”

报告摘要:

文生图扩散模型依旧容易生成局部问题(artifacts),我们提出“先诊断再治疗”的训练范式,通过先侦测出生成图像中的局部问题区域,来为扩散模型提供像素级别的反馈信息进行训练,以减少模型生成局部问题,同时保持模型固有的生成质量。

讲者简介:

汪逸阳是香港大学计算机系一年级博士生,导师为赵恒爽教授。于此之前,本科毕业于北京大学。主要研究方向为图像生成与理解。

讲者主页:https://scholar.google.com/citations?user=nKr8TJwAAAAJ&hl=en


报告嘉宾:季思慧(香港大学)

报告时间:2025年4月3号星期四晚上8:40-9:00(北京时间)

报告题目:FashionComposer:灵活可控的人物时尚图像组合生成

报告摘要:

我们提出了FashionComposer,一种灵活的组合时尚图像生成方法。它支持多模态输入(如文本提示、3D人体姿态、服装图像和人脸图像),并能够同时定制多种外观、姿势和体型。我们开发了一个通用框架,支持多种输入方式,并构建大规模训练数据提高模型的组合生成能力,还支持人物相册生成、虚拟试衣等应用。

讲者简介:

季思慧是香港大学计算机系一年级博士生,导师为赵恒爽教授。于此之前,本科毕业于浙江大学。主要研究方向为图像与视频生成,以第一作者在国际顶级会议发表论文2篇。

讲者主页:https://scholar.google.com/citations?hl=zh-CN&user=a6GxOZgAAAAJ


主持人简介:

徐晓刚目前在华为2012实验室-中央媒体院担任天少专家岗位。于2018年在浙江大学信息工程专业获得工学学士学位,于2022年在香港中文大学获得博士学位,获香港政府奖学金。目前累计在CVPR,ICCV,TPAMI等期刊会议上发表论文五十余篇,引用量4600余次。此前,徐晓刚在之江实验室担任研究专家(PI),同时兼聘于浙江大学计算机科学与技术学院CAD国家重点实验室,担任百人计划研究员,获得之江青年人才托举,之江优秀青年科学基金,浙江省鲲鹏计划,自然科学基金重大项目等支持。并且在香港中文大学,马普所,牛津大学等地进行过访问研究。徐晓刚的研究方向主要是生成式计算摄影,多模态生成和理解大模型,以及安全对齐方向。


GAMES主页的“使用教程”中有 “如何观看GAMES Webinar直播?”及“如何加入GAMES微信群?”的信息;
GAMES主页的“资源分享”有往届的直播讲座的视频及PPT等。
观看直播的链接:https://live.bilibili.com/h5/24617282

You may also like...