(通讯员:张欢)近日,CCF A类国际学术会议CVPR 2023论文接收结果公布,西电人工智能学院师生有6篇论文被录用。
CVPR,全称计算机视觉和模式识别会议( IEEE / CVF Computer Vision and Pattern Recognition Conference),该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议,在世界范围内每年召开一次,本届会议录用率为25.78%。
● 论文题目:Curvature-Balanced Feature Manifold Learning for Long-Tailed Classification
作者:马彦彪,焦李成*,刘芳,杨淑媛,刘旭,李玲玲(带*的为通讯作者)
论文概述:在该论文中,作者系统地提出了深度神经网络中感知流形的一系列几何度量,探讨了感知流形的几何特性对分类难度的影响以及学习如何塑造感知流形的几何特性。针对在训练过程中曲率不平衡导致的模型偏差问题,作者提出曲率正则化,以促进模型学习曲率平衡和更平坦的感知流形。对多个长尾和非长尾数据集的评估表明,作者的方法在目前最新技术的基础上实现了性能的显著提高。该论文的工作开辟了关于模型偏差的几何分析视角,能够助力研究人员关注非长尾甚至样本平衡数据集上的模型偏差,以推动更公平的AI发展。
● 论文题目:Video Event Restoration Based on Keyframes for Video Anomaly Detection
作者:杨智伟,刘静*,毋朝阳,吴鹏*,刘晓涛
论文概述:在本论文中,作者基于视频编解码理论,提出了一种全新的视频异常检测范式:基于关键帧还原视频事件用于视频异常检测。作者提出了一个新颖的带有双向跳跃连接的U型Swin Transformer网络(USTN-DSC)用于视频事件还原,其中设计的跨注意力和时序上采样残差跳跃连接用来进一步辅助还原视频中复杂的静态和动态运动目标特征。另外,该论文还提出了一个简单有效的邻帧差分时序损失函数,用于约束视频序列的时序一致性。实验结果表明了该论文方法的有效性,USTN-DSC的性能也优于现有的大多数方法。
● 论文题目:Towards Better Stability and Adaptability: Improve Online Self-Training for Model Adaptation in Semantic Segmentation
作者:赵栋,王爽*,臧琪,权豆,叶秀眺,焦李成
论文概述:访问源数据的需求使得传统域适应无法处理涉及隐私、产权保护和机密性的适应场景。在本文中,作者专注于无监督模型自适应,它可以在不访问源数据的情况下使源训练模型适应目标域。作者发现,在线自训练方法在模型适应场景中具有很大的应用潜力,但是缺少源域损失会大大削弱该方法的稳定性和适应性。通过分析在线自我训练退化的两个原因,即教师模型更新不当和来自源训练模型的知识偏差,该论文提出了动态教师更新机制和基于训练一致性的重采样策略,以提高在线自训练的稳定性和适应性。在多个模型适应基准上,该论文的方法获得了新的先进性能,与最先进的可访问源域的域适应方法相当甚至表现更好。
● 论文题目:Vector Quantization with Self-attention for Quality-independent Representation Learning
作者:杨州,董伟生*,李欣,黄孟銮,孙玉林,石光明
论文概述:论文针对深度神经网络从低质量图像中提取到的特征可能包含很多噪声等干扰信息,导致模型性能下降的问题,受稀疏表示去冗余的启发,提出基于向量量化的图像质量无关的特征学习方法。该方法能够通过特征的量化表示,去除特征中的冗余信息,保留关键特征,提升模型在低质量图像上的识别性能。充分的实验结果也证明了论文所提出方法的有效性。
● 论文题目:Self-supervised Non-uniform Kernel Estimation with Flow-based Motion Prior for Blind Image Deblurring
作者:方振轩,毋芳芳*,董伟生,李欣,吴金建,石光明
论文概述:针对图像拍摄过程中的图像模糊问题,该论文提出了一种基于隐空间先验非均匀模糊核估计的图像盲去模糊方法,利用标准化流模型将复杂的运动模糊核空间映射为简单的高斯分布空间,采用在图像隐空间内估计模糊核的方法,充分利用运动模糊核的先验信息,从而大幅提高模糊核估计准确性,并将估计出的模糊核用于提高图像去模糊的效果,继而恢复出更高的视觉质量,适用于需要产生清晰图像的场景。
● 论文题目:Residual Degradation Learning Unfolding Framework with Mixing Priors across Spectral and Spatial for Compressive Spectral Imaging
作者:董宇波,高大化*,邱添,李雨嫣,杨旻曦,石光明
论文概述:目前,压缩光谱成像将三维光谱图像压缩为二维观测图像常被用于解决传统高光谱相机存在的成像速度慢、占用存储大等问题,因此,如何将二维观测图像高保真地恢复为三维高光谱图像是压缩光谱成像的关键。深度展开网络已经成功应用于压缩光谱成像的复原,该论文提出将残差退化学习集成到求解数据子问题的过程,并且提出一种混合空间-光谱先验的Transformer网络用于求解先验子问题。实验结果表明,论文提出的方法效果大幅超过了现有方法。