GAMES Webinar 2026 – 392期(基于多模态模型的智能可视化技术) | 宋思程（香港科技大学），叶依林（清华大学）

by 木折_Oreki · 2026年1月11日

GAMES Webinar 2026 – 392期(基于多模态模型的智能可视化技术)

报告嘉宾：宋思程（香港科技大学）

报告时间：2026年01月15号晚上8:00-8:30（北京时间）

报告题目：当数据会撒谎：利用多模态模型解构误导性可视化与提升批判性思维

报告摘要：

在智能可视化领域，如何让机器像人一样“读懂”图表，进而辅助人类“看清”数据，始终是核心挑战。我们早期的研究主要致力于图表的“结构化理解”，即通过逆向工程技术从位图图像中精准还原数据与视觉样式，为机器理解图表奠定了坚实基础。然而，随着生成式AI的爆发，可视化理解面临的挑战已从单纯的像素解析延伸至更复杂的语义与认知层面——即如何应对视觉误导和恶意篡改。本报告将探讨如何利用多模态大模型技术，构建从机器智能鉴伪到可视化素养提升的完整闭环。我们首先关注机器视角的“鉴伪”能力，介绍误导可视化基准数据集，通过覆盖21种误导类型的大规模评测，揭示了当前模型在识别视觉陷阱时的能力边界，并提出区域感知推理方法以显著提升其辨识精度。针对图表传播中的真实性风险，我们提出了一种结合半脆弱水印与大模型推理的主动分析框架，不仅能精准定位图表内容的像素级变动，更能深度解析篡改背后的潜在意图。最后，我们将技术红利反哺于人类教育，利用大模型模拟不同认知水平的“学生智能体”，辅助设计高质量的可视化素养评估题目，通过人机协作的方式，帮助公众提升对误导性图表的批判性思维与辨别能力。

讲者简介：

宋思程，香港科技大学计算机科学与工程系博士后研究员。博士毕业于华东师范大学计算机科学与技术学院。研究聚焦于可视化与人工智能的交叉领域，主要研究方向为图可视化、可视化逆向工程以及人工智能驱动的智能教育技术。他的研究成果已发表在IEEE TVCG、ACM CHI、UIST、EMNLP和IEEE VR等国际会议与期刊10余篇，其中CCF A类一作论文5篇，获得国家授权发明专利2项。长期担任VIS、CHI、TVCG等国际期刊及会议的审稿人。

讲者主页：byshawn.github.io

报告嘉宾：叶依林（清华大学）

报告时间：2026年01月15号晚上8:30-9:00（北京时间）

报告题目：多模态对齐的降维可视化视角

报告摘要：

多模态嵌入表示如CLIP在视觉语言模型的高维特征空间中对齐不同模态（如文本、图像）的数据，为下游多模态任务如文生图、图文检索奠定基础。降维可视化可以帮助探索理解多模态数据的嵌入表示。然而，传统的降维方法没有考虑多模态嵌入在同一空间却又存在模态距离的特殊性质，难以充分展示对齐关系。我的研究关注了多模态嵌入降维的两个基础问题。第一个问题将文本和图像视为不同对象，投影到同一可视化空间，观察文本嵌入和图像嵌入之间的关系。为解决这一问题我们提出了Modal Fusion Map降维方法，并展示其在图文检索和文生图可视化中的应用；第二个问题将成对的文本和图像（如文生图的提示词和结果）视为一个整体进行降维，观察图文对的模态距离分布。为解决这一问题我们提出了AKRMap降维方法，并展示了在文生图和文生3D评估中的应用。

讲者简介：

叶依林，清华大学软件学院博士后研究员，水木学者。博士毕业于香港科技大学跨学科研究学院。他的研究关注数据可视化、人机交互和人工智能的交叉领域，重点聚焦基于高维嵌入流形学习的人-AI交互问题，通过开发高维嵌入降维与检索方法，支持用户与多模态数据和生成式模型进行交互。相关研究已发表10余篇CCF-A文章，其中以一作发表5篇于VIS, ICML, CSCW, TVCG等可视化、人机交互、人工智能领域顶会及顶刊，并以通讯作者获得CHI最佳论文提名。担任VIS, CHI, TVCG, PacificVIS, IUI等审稿人。

讲者主页：https://yilinye.github.io/

主持人简介：

李晨辉，华东师范大学计算机科学与技术学院副教授，博士生导师，CCF计算机辅助设计与图形学专委会执行委员，CSIG可视化与可视分析专委会委员。博士毕业于香港理工大学，研究方向包括数据可视化、计算机图形学、智能艺术设计等，主持国家自然科学基金面上项目、国家重点研发计划项目子课题、上海市自然科学基金项目、华为委托项目等十余项，在IEEE TVCG、IEEE VIS、CVPR、ICML、NeurIPS、ACM CHI等国际会议及国际期刊上发表学术论文50余篇，其中CCF A或Trans.论文30余篇；担任VCIBA国际期刊青年编委、IEEE VIS等国际会议程序委员会委员；6次担任国内学术会议论文主席或组织主席，曾获2次国际学术会议最佳论文奖，曾获2020年度上海市科技进步特等奖、2022年度上海市高等教育教学成果二等奖、2023年全国高校美育优秀案例、2024年度上海市计算机学会科学技术奖二等奖。更多信息见：http://chenhui.li

陆旻，深圳大学建筑与城市规划学院副教授，博士生导师，空间创意智能生成和交互研究组负责人。现任CSIG可视化与可视分析专委会委员，计算机图形学与混合现实在线平台（GAMES）执行委员。近年来主持国家自然科学基金2项、广东省自然科学基金1 项、深圳市科技项目2项。在SIGGRAPH，CVPR，VIS，CHI等CCF-A类国际会议和期刊上发表论文20余篇，曾获ChinaVis 2016最佳海报奖、ICUI 2017最佳论文奖、IEEE PacificVis 2018最佳海报奖、Computational Visual Media 2020最佳论文提名、IEEE PacificVis 2024最佳论文提名等奖项。担任ACM SIGGRAPH, IEEE PacificVis、ChinaVis等会议程序委员，TVCG、CG&A、CAD&CG等期刊的审稿人。更多信息：https://deardeer.github.io/

GAMES主页的“使用教程”中有 “如何观看GAMES Webinar直播？”及“如何加入GAMES微信群？”的信息；
GAMES主页的“资源分享”有往届的直播讲座的视频及PPT等。
观看直播的链接：https://live.bilibili.com/h5/24617282