专题论坛
论坛1:视觉大模型
观点嘉宾(按姓氏拼音排序)
|
|
|
|
陈昊 |
代季峰 |
王鑫龙 |
浙江大学 |
清华大学 |
北京智源研究院 |
- 观点嘉宾:陈昊
- 报告题目:开放世界的多任务感知
-
嘉宾简介:陈昊,浙江大学计算机学院百人计划研究员。研究兴趣为计算视觉和人工智能。发表国际著名学术期刊和会议论文30余篇,谷歌学术引用7000余次。所做工作受邀在多个CCF A类国际会议做口头报告。其中全卷积目标检测框架FCOS为ICCV近年第二高引论文。主导开发的自研开源算法库在学术界和工业界被广泛使用,GitHub获得2000+关注。在文字检测、深度估计、语义分割、自动驾驶感知等多项国际人工智能算法竞赛中获得冠军。
- 观点嘉宾:代季峰
- 报告题目:适用于视觉开放任务的通用解码器
-
嘉宾简介:代季峰,清华大学电子工程系副教授,博士生导师,上海人工智能实验室领军科学家。在2009年和2014年于清华大学自动化系分别获得工学学士和博士学位,博士导师周杰教授。2014年至2019年在微软亚洲研究院视觉组工作,担任首席研究员、研究经理。2019年至2022年在商汤科技研究院工作,担任执行研究总监,二级部门长。2022年7月全职加入清华大学电子工程系。他的研究兴趣包括计算机视觉、深度学习等。他在相关领域发表国际期刊、会议文章50余篇,论文总引用3万余次。以可变形卷积为代表的多篇论文成为物体识别领域里程碑式的成果,被编入世界一流大学视觉课程讲义,被选入深度学习权威框架PyTorch成为标准算子。他连续两年获得物体识别领域权威的COCO比赛冠军,之后历届冠军系统也使用了他提出的算法。他提出的算法获得自动驾驶感知领域权威的Waymo 2022竞赛冠军。他是顶刊IJCV的编委,和顶会NeurIPS , ICCV,CVPR,ECCV的领域主席,ICCV 2019的宣传主席。
- 观点嘉宾:王鑫龙
- 报告题目:从视觉到多模态基础模型
-
嘉宾简介:王鑫龙, 智源研究院视觉模型研究中心负责人。博士毕业于澳大利亚阿德莱德大学,师从沈春华教授,本科毕业于同济大学。他的研究兴趣是计算机视觉和基础模型, 近几年研究工作包括视觉感知 (SOLO, SOLOv2),视觉表征 (DenseCL, EVA),视觉通才模型(Painter, SegGPT),多模态表征(EVA-CLIP),多模态通才模型(Emu)。曾获Google PhD Fellowship和阿德莱德大学博士 研究奖章。
- 观点嘉宾:王鑫涛
- 报告题目:视觉内容生成的初步探索和简单思考
-
嘉宾简介:王鑫涛,腾讯ARC Lab和AI Lab专家研究员,本科毕业于浙江大学,博士毕业于香港中文大学,目前主要研究视觉AIGC相关内容,特别是图像与视频的生成与编辑工作。在国际顶级会议期刊发表多篇文章,发表的工作包括ESRGAN,GFPGAN,T2I-Adapter等。
- 观点嘉宾:魏龙辉
- 报告题目:华为云视觉与多模态预训练技术初探及思考
-
嘉宾简介:魏龙辉,华为云多模态预训练模型研发负责人。19年毕业于北京大学,他当前的研究兴趣为视觉预训练、图文多模态理解与生成等相关前沿内容。已在国际顶级学会会议及期刊发表20+篇论文,其中包括视觉预训练算法MVP,多模态理解预训练算法LOUPE等。谷歌学术总引用量达3000余次。
- 观点嘉宾:杨铭
- 报告题目:蚂蚁多模态基础大模型的探索与实践
-
嘉宾简介:杨铭,西北大学博士,蚂蚁集团研究员,负责多模态认知相关技术研发,包括图像视频识别检索、多模态基础大模型、AIGC可控图像生成、卫星遥感图像识别等;先后就职于NEC美国实验室、 脸书FAIR研究院、地平线机器人公司,世界知名计算机视觉研究专家,在CVPR/ICCV/T-PAMI等国际会议和期刊上发表论文近百篇,被引用超过23000次,其中在 Facebook 工作期间负责的深度学习项目 DeepFace在业界产生重大影响,被引用超过7700次。
论坛主持人
|
|
乔宇 |
上海人工智能实验室 |
-
个人简介:乔宇,上海人工智能实验室教授。从事计算机视觉与深度学习领域研究,领导研发了国内首个广泛覆盖多种视觉任务的通用大模型“书生”,标杆任务性能国际领先。发表学术论文300余篇,累计被引五万千余次,H-index为81。以第一完成人获广东省技术发明一等奖、中国人工智能学会吴文俊人工智能科技进步二等奖等,获中科院卢嘉锡青年人才奖。获CVPR2023最佳论文奖、AAAI 2021杰出论文奖、世界人工智能大会青年论文奖等。入选国家级人才计划、科技部中青年科技创新领军人才、上海市优秀学术带头人、中科院百人计划等。
论坛2:三维AIGC
观点嘉宾(按姓氏拼音排序)
|
|
|
|
戴勃 |
韩晓光 |
刘利斌 |
上海人工智能实验室 |
香港中文大学(深圳) |
北京大学 |
- 观点嘉宾:戴勃
- 报告题目:3D AIGC 如何承前启后?
-
嘉宾简介:戴勃,上海人工智能实验室青年科学家,内容生成与数字
化研究团队负责人,书生天际城市级实景三维大模型负责人,
曾任新加坡南洋理工大学研究助理教授。研究领域为AIGC,
希望通过研究实现多快好省的虚拟内容生产。
在人工智能顶级会议和期刊发表相关论文共计40余篇。
近期代表性成果书生天际LandMark,AnimateDiff,Matlaber
- 观点嘉宾:韩晓光
- 报告题目:AIG-3D 怎么卷?
-
嘉宾简介:韩晓光博士,现任香港中文大学(深圳)理工学院助理教授,校长青年学者。 他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文60余篇, 包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助, 香港中文大学(深圳)青年科研奖。目前也担任CVPR2023,NeurIPS 2023以及CVPR2024领域主席。他的工作还曾两次获得CCF图形开源数据集奖(DeepFashion3D和MVImgNet), 2019年和2020年连续两年入选计算机视觉顶级会议CVPR最佳论文列表(入选率分别为0.8%和0.4%),他也曾获得IEEE TVCG最佳审稿人提名奖。
- 观点嘉宾:刘利斌
- 报告题目:Towards Realistic and Interactive Human Behaviors in AIGC
-
嘉宾简介:刘利斌,北京大学智能学院助理教授。博士毕业于清华大学,后曾于加拿大不列颠哥伦比亚大学(The University of British Columbia)及美国迪士尼研究院(Disney Research)进行博士后研究,以及美国硅谷创业公司DeepMotion Inc.担任首席科学家。主要研究方向是计算机图形学,特别是数字人建模与动画、物理仿真、运动控制以及相关的优化控制、机器学习、增强学习等领域。他曾获得 SIGGRAPH Asia 2022 Best Paper Award、SIGGRAPH 2023 Honorable Mention Award 等奖项,并多次担任图形学领域重要国际会议如SIGGRAPH (North America/Asia)、EG、PG、SCA等的论文程序委员,以及图形学领域主要会议和期刊的审稿人。
- 观点嘉宾:刘烨斌
- 报告题目:3D AIGC前沿进展
-
嘉宾简介:刘烨斌,清华大学自动化系长聘教授。研究方向为三维视觉、数字人重建与生成研究,发表TPAMI/SIGGRAPH/CVPR/ICCV等论文近百篇。担任IEEE TVCG及CGF编委,多次担任CVPR、ICCV、ECCV领域主席,SIGGRAPH Asia技术委员会委员。任中国图象图形学会三维视觉专委会副主任。获2012年国家技术发明一等奖(排名3),2019年中国电子学会技术发明一等奖(排名1)。获2021年国家基金委杰出青年基金资助。
- 观点嘉宾:张举勇
- 报告题目:Controlled Generation of 3D Content with Labels
-
嘉宾简介:张举勇,中国科学技术大学数学科学学院教授,获国家基金委优秀青年基金、中科院青促会优秀会员资助。 2006年本科毕业于中科大计算机系,2011年博士毕业于新加坡南洋理工大学,2011年至2012年于瑞士联邦理工学院洛桑分校从事博士后研究。 研究领域为计算机图形学与三维视觉,近期主要研究兴趣为基于神经隐式表示、逆向渲染与数值优化方法对真实物理世界进行高效高保真三维数字化, 以及高真实感虚拟数字内容的创建。
- 观点嘉宾:周子寒
- 报告题目:AI驱动的计算机辅助空间设计
-
嘉宾简介:周子寒,清华大学自动化学士,美国伊利诺伊大学电子与计算机工程博士。2013年1月至2021年4月就职于美国宾夕法尼亚州立大学信息科学与技术学院,历任研究员,助理教授(博士生导师),研究三维计算机视觉。2021年5月起就职于杭州群核信息技术有限公司,任首席科学家,致力于下一代3D云设计技术的自主研发,并推动AI与计算机辅助设计新兴交叉领域的科研探索。
-
个人简介:许威威,现任浙江大学计算机科学与技术学院CAD&CG国家重点实验室长聘教授,教育部长江学者。曾任日本立命馆大学博士后,微软亚洲研究院网络图形组研究员, 杭州师范大学浙江省钱江学者特聘教授。主要研究方向为计算机图形学,涵盖三维重建、深度学习、物理仿真。在国内外高水平学术会议和期刊发表论文100余篇,其中ACM Transactions on Graphics, IEEE TVCG、IEEE CVPR、AAAI等CCF-A类论文40余篇。获中国和美国授权专利15项。所开发的三维注册和重建技术在高精度扫描仪及人体三维重建系统中得到应用。2014年受国家自然科学基金优秀青年基金资助,主持国家自然科学基金重点项目一项,获浙江省自然科学二等奖一项