特邀报告
- 特邀报告1:基于生成模型的三维内容生成:初步探索与思考(童欣,微软亚洲研究院)
- 特邀报告2:多模态扩散模型及其应用(朱军,清华大学)
- 特邀报告3:“书生”通用大模型体系(乔宇,上海人工智能实验室)
- 特邀报告4:从生成式人工智能到组合式人工智能(段楠,微软亚洲研究院)
- 特邀报告5:基于混合表面表征的三维建模与内容生成(贾奎,香港中文大学(深圳)数据科学学院)
特邀报告1:基于生成模型的三维内容生成:初步探索与思考
报告讲者 |
---|
童欣 |
微软亚洲研究院 |
- 报告摘要:近年来基于生成模型的图片,文字的自动生成取得了巨大的进展,并且展示了其在三维内容生成方面的巨大潜力。在这个报告中,我介绍一下我们在过去几年所作的一些初步的探索,面临的挑战,并分享我们在这一方向的一些初步的思考。
- 讲者简介:童欣,微软亚洲研究院全球研究合伙人(Partner Researcher),网络图形组研究主管。主要研究方向为计算机图形学和三维视觉,研究兴趣包括纹理合成,真实感绘制,材质建模,三维几何学习,人脸动画,图形系统等。多次担任SIGGRAPH/SIGGRAPHASIA论文委员会委员,曾任ACM TOG,IEEE TVCG,CGF编委。目前任IEEE TVCG的AEIC。童欣博士1999年获得清华大学博士学位,之前于1993年和1996年获得浙江大学本科和硕士学位。
特邀报告2:多模态扩散模型及其应用
报告讲者 |
---|
朱军 |
清华大学 |
- 报告摘要:AIGC发展迅速,扩散概率模型是AIGC的关键技术之一,在跨模态的文图生成、3D生成、视频生成等方面取得显著进展。该报告将介绍扩散概率模型的若干进展,包括大规模多模态扩散模型的构建以及基于预训练扩散模型的高效文到3D生成、可控视频生成等内容。
- 讲者简介:朱军,清华大学计算机系Bosch AI教授、IEEE Fellow,清华大学人工智能研究院副院长,曾任卡内基梅隆大学兼职教授。2001-2009年获清华大学学士和博士学位,主要从事机器学习研究,担任国际著名期刊IEEE TPAMI的副主编,担任ICML、NeurIPS、ICLR等(资深)领域主席20余次。获求是杰出青年奖、科学探索奖、中国计算机学会自然科学一等奖、吴文俊人工智能自然科学一等奖、ICLR国际会议杰出论文奖等,入选万人计划领军人才、中国计算机学会青年科学家、MIT TR35中国先锋者等。
特邀报告3:“书生”通用大模型体系
报告讲者 |
---|
乔宇 |
上海人工智能实验室 |
- 报告摘要:近年来预训练语言大模型推动人工智能技术取得突破性进展,成为通向通用人工智能的重要途径。视觉是人感知和理解世界的重要媒体,也是人工智能的核心领域。与传统视觉模型一个模型往往针对一个问题不同,通用视觉旨在建立统一的方法体系,以一个模型体系应对多种视觉任务,并提升开发环境理解、认知推理能力。这个报告将介绍上海人工智能实验室“书生”通用大模型体系的最新进展以及未来的发展趋势。
- 讲者简介:乔宇,上海人工智能实验室教授。从事计算机视觉与深度学习领域研究,领导研发了国内首个广泛覆盖多种视觉任务的通用大模型“书生”,标杆任务性能国际领先。发表学术论文300余篇,累计被引五万千余次,H-index为81。以第一完成人获广东省技术发明一等奖、中国人工智能学会吴文俊人工智能科技进步二等奖等,获中科院卢嘉锡青年人才奖。获CVPR2023最佳论文奖、AAAI 2021杰出论文奖、世界人工智能大会青年论文奖等。入选国家级人才计划、科技部中青年科技创新领军人才、上海市优秀学术带头人、中科院百人计划等。
特邀报告4:从生成式人工智能到组合式人工智能
报告讲者 |
---|
段楠 |
微软亚洲研究院 |
- 报告摘要:本报告首先围绕MSRA女娲项目介绍生成式人工智能(Generative AI)在多模态内容生成领域的一些最新进展,并此基础上进一步提出组合式人工智能(Compositional AI)概念,旨在基于生成式人工智能技术和各种外部模块和工具,构建具备知识获取、长期记忆、任务规划、精准计算、和复杂推理等能力的AI智能体,用于完成数字世界和物理世界中各类任务。
- 讲者简介:段楠,微软亚洲研究院资深首席研究员,自然语言计算团队研究经理,中国科学技术大学、西安交通大学兼职博导,天津大学兼职教授,主要从事自然语言处理、多模态智能、代码智能、机器推理等研究,多次担任NLP/AI学术会议程序主席和领域主席,发表学术论文100余篇,Google Scholar引用10000余次,持有专利20余项。
特邀报告5:基于混合表面表征的三维建模与内容生成
报告讲者 |
---|
贾奎 |
香港中文大学(深圳)数据科学学院 |
- 报告摘要:对三维表面和材质纹理进行建模学习是实现三维内容生成的基础。现有方法多基于隐式表面表达,并耦合表面与材质纹理学习,通过体渲染的方式实现从二维图像到三维形状的关联,进而实现三维内容自动生成;但这种耦合造成精细的表面几何难以恢复,也无法进行真实感表面渲染。本报告首先阐述我们最近提出的一个高质量三维内容生成工作;它通过解耦表面几何与材质纹理学习,并基于混合表面表征实现精细化的表面几何与颜色生成,并能够与现有图形学管线无缝衔接。本报告进而讲述我们最近提出的进阶混合表面表征,它通过更好地统一显式表面建模学习与隐式场学习,实现高效和高质量的表面生成。本报告最后讲述我们在任意形状物体六自由度姿态估计方面的最新研究进展。
- 讲者简介:贾奎,教授,现就职于香港中文大学(深圳)数据科学学院。分别于西北工业大学、新加坡国立大学、伦敦大学玛丽女王学院获得学士、硕士、和博士学位。博士毕业后,曾先后于中科院深圳先进技术研究院、香港中文大学、伊利诺伊大学香槟分校新加坡高等研究院、澳门大学、及华南理工大学从事教学和科研工作。他的主要研究领域是机器学习与计算机视觉,近期主要聚焦深度学习及其泛化、生成式三维建模与学习、三维感知大模型等方向。他的研究受到国家自然科学基金、广东省科技厅、华为、微软等机构和企业的资助,他的研究成果应用于奥比中光三维传感器产品及三星(美国)无人驾驶系统中。贾奎教授是跨维智能创始人,目前担任Trans. on Machine Learning Research, IEEE Trans. on Image Processing等期刊副主编