GAMES Webinar 2024 – 361期(AIGC图像生成与编辑新进展) | 陈汐(香港大学)，汪逸阳(香港大学)，季思慧(香港大学)

by 木折_Oreki · 2025年3月31日

【GAMES Webinar 2025-361期】(视觉专题-AIGC图像生成与编辑新进展)

报告嘉宾：陈汐(香港大学)

报告时间：2025年4月3号星期四晚上8:00-8:20（北京时间）

报告题目：UniReal: 从视频中学习统一的图像生成与编辑

报告摘要：

我们提出名为UniReal的图像编辑与生成统一范式，将多种图像任务统一到视频生成框架中，通过将不同类别和数量的输入输出图像建模为视频帧，从大规模真实视频数据中学习属性、姿态、光照等多种物理规律，从而实现高保真的生成效果。

讲者简介：

陈汐是香港大学计算机系三年级博士生，导师为赵恒爽教授。于此之前，本科硕士毕业于浙江大学，并且获得法国马赛中央理工双硕士学位。主要研究方向为图像视频生成与理解。在国际顶级会议期刊发表论文二十余篇（一作8篇），引用量1600余次，GitHub star 6,000余次，其研究成果入选CVPR最具影响力论文榜单。

讲者主页：https://xavierchen34.github.io/

报告嘉宾：汪逸阳(香港大学)

报告时间：2025年4月3号星期四晚上8:20-8:40（北京时间）

报告题目：DiffDoctor：“诊断”文生图模型的局部问题再加以“治疗”

报告摘要：

文生图扩散模型依旧容易生成局部问题（artifacts），我们提出“先诊断再治疗”的训练范式，通过先侦测出生成图像中的局部问题区域，来为扩散模型提供像素级别的反馈信息进行训练，以减少模型生成局部问题，同时保持模型固有的生成质量。

讲者简介：

汪逸阳是香港大学计算机系一年级博士生，导师为赵恒爽教授。于此之前，本科毕业于北京大学。主要研究方向为图像生成与理解。

讲者主页：https://scholar.google.com/citations?user=nKr8TJwAAAAJ&hl=en

报告嘉宾：季思慧(香港大学)

报告时间：2025年4月3号星期四晚上8:40-9:00（北京时间）

报告题目：FashionComposer：灵活可控的人物时尚图像组合生成

报告摘要：

我们提出了FashionComposer，一种灵活的组合时尚图像生成方法。它支持多模态输入（如文本提示、3D人体姿态、服装图像和人脸图像），并能够同时定制多种外观、姿势和体型。我们开发了一个通用框架，支持多种输入方式，并构建大规模训练数据提高模型的组合生成能力，还支持人物相册生成、虚拟试衣等应用。

讲者简介：

季思慧是香港大学计算机系一年级博士生，导师为赵恒爽教授。于此之前，本科毕业于浙江大学。主要研究方向为图像与视频生成，以第一作者在国际顶级会议发表论文2篇。

讲者主页：https://scholar.google.com/citations?hl=zh-CN&user=a6GxOZgAAAAJ

主持人简介：

徐晓刚目前在华为2012实验室-中央媒体院担任天少专家岗位。于2018年在浙江大学信息工程专业获得工学学士学位，于2022年在香港中文大学获得博士学位，获香港政府奖学金。目前累计在CVPR,ICCV,TPAMI等期刊会议上发表论文五十余篇，引用量4600余次。此前，徐晓刚在之江实验室担任研究专家（PI），同时兼聘于浙江大学计算机科学与技术学院CAD国家重点实验室，担任百人计划研究员，获得之江青年人才托举，之江优秀青年科学基金，浙江省鲲鹏计划，自然科学基金重大项目等支持。并且在香港中文大学，马普所，牛津大学等地进行过访问研究。徐晓刚的研究方向主要是生成式计算摄影，多模态生成和理解大模型，以及安全对齐方向。

GAMES主页的“使用教程”中有 “如何观看GAMES Webinar直播？”及“如何加入GAMES微信群？”的信息；
GAMES主页的“资源分享”有往届的直播讲座的视频及PPT等。
观看直播的链接：https://live.bilibili.com/h5/24617282