
近日,软件学院举办“智能・软件・未来”论坛第13期:视频压缩与理解系列讲座第2期,邀请北京航空航天大学电子信息工程学院副教授邓欣作题为“稀疏驱动的多模态图像智能处理”的学术报告。
当前,多模态图像处理已在遥感探测、医疗成像、自动驾驶等关键领域实现广泛应用,不同成像模态虽能提供互补信息,但模态间的差异性也为数据联合处理带来巨大挑战。传统深度学习方法虽在处理性能上表现突出,却因缺乏可解释性成为“黑箱”模型,难以满足实际应用中对模型逻辑透明度的需求。针对这一行业痛点,邓欣教授团队提出以稀疏建模为核心的技术路径,利用其能有效捕捉图像本质特征的优势,为多模态数据构建数学基础扎实的耦合表示方式。在此基础上,团队进一步探索基于稀疏建模的多模态可解释网络,通过构建多模态耦合稀疏表征模型,将稀疏先验融入网络架构设计全过程,使模型整体及各功能模块均具备清晰的物理解释,推动神经网络从“被动理解数据”向“主动设计逻辑”转型。该技术方案在多模态图像配准、图像融合与目标检测等核心任务中均展现出优异性能,充分验证了稀疏驱动多模态模型在实际场景中的应用潜力与实用价值。
邓欣,北京航空航天大学副教授、博士生导师,CSIG宣传工作委员会秘书长、CCF多媒体技术专业委员会执行委员、CSIG图像视频通信专业委员会委员、VALSE执行委员。长期致力于多模态图像处理与可解释性神经网络领域研究,在人工智能顶级期刊TPAMI、图像处理顶级期刊TIP以及计算机视觉领域国际顶会ICCV、CVPR等发表论文60余篇。曾获2023年度北京市自然科学一等奖(排名2/核心成员)、第13届吴文俊人工智能自然科学一等奖(排名2/核心成员)、第14届吴文俊人工智能青年科技奖、2021年度中国图象图形学学会石青云女科学家奖,入选2025年度北京市科技新星、2021年度英国Eryl Cadwallader Davies Prize、斯坦福大学全球前2%顶尖科学家榜单。
(文/图:高艳博 责任编辑:刘士军)