研究方向

目标检测与跟踪(VOD & VOT)




在计算机视觉中,目标检测是在图像和视频目标进行定位和识别。视觉目标跟踪任务就是在给定某视频序列初始帧的目标大小与位置的情况下,预测后续帧中该目标的大小与位置。目标跟踪是计算机视觉中的一个重要研究方向,有着广泛的应用,如:视频监控,人机交互, 无人驾驶等。




显著性目标检测(SOD)



显著性目标检测任务是根据视觉显著性特征,检测出图像或者视频中人眼最关注的目标或区域。显著性目标检测任务跨越认知心理学、神经科学和计算机视觉等多个学科,是计算机视觉领域一个基础研究问题。从1998年发展至今,显著性目标检测大约可以划分为传统方法与深度学习方法两个时代。显著性目标检测广泛应用在图像理解,图像描述,目标检测,无监督的视频目标分割,语义分割,行人重识别,图像自动裁剪,图像重定位,视频摘要等。





视频分割(VOS)




视频目标分割是计算机视觉的基础任务,广泛应用于视频编辑、内容生产、自动驾驶等领域。在视频序列中,目标物体往往会因为连续运动和视角变化发生很大的外观改变,包括形变和遮挡。同时视频中往往会有和目标相似的其他物体存在,使得分辨目标更加困难。





深度估计(Depth Estimation)






深度估计,就是获取图像中场景里的每个点到相机的距离信息,这种距离信息组成的图我们称之为深度图。例如在自动驾驶中,如何获取车辆行人等目标的深度信息,是当前研究的技术热点。由于相机价格低廉、获取信息内容丰富,体积小巧等优点,成为自动驾驶领域较为热门的传感器技术之一。相应地,视觉深度估计也受到了研究的热捧,受到了更多的关注。








行人再识别(Person re-identification)







行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人,是智能视频分析领域一项新技术,属于在复杂视频环境下的图像处理和分析范畴,在计算机视觉领域获得了越来越多的关注。行人再识别被认为是一个图像检索的子问题,一般给定一个监控行人图像,跨设备检索该行人,这项研究目的旨在弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。















超分辨率(Super-resolution)

图像的超分辨率重建技术指的是将给定的低分辨率图像通过特定的算法恢复成相应的高分辨率图像。超分辨率重建技术目的是克服或补偿由于图像采集系统或采集环境本身的限制,导致的成像图像模糊、质量低下、感兴趣区域不显著等问题。传统超分辨重建技术包括:插值、重建、机器学习等方法。基于深度学习的超分辨率重建技术是目前主流方法。超分辨率是计算机视觉领域一个非常重要的研究问题,在医疗图像分析、卫星遥感、视频监控等实际场景中有着广泛的应用。


事件相机(Event-based cameras)




事件相机是一种受人脑启发的神经形态相机,以异步的方式捕捉连续时刻的视觉信号变化,具有高时间分辨率、高动态、低功耗的特点。借助事件相机,可以实现在高速运动、极低光照等挑战条件下,对场景中物体进行清晰成像和精准感知。






多模态融合与处理(Multimodal Fusion)



每一种信息的来源或者形式,都可以称为一种模态。多模态是指两个或者两个以上模态的组合。目前在计算机视觉领域,多模态研究主要是针对图像,文本,语音等模态的融合与处理。多模态数据的融合可以为模型决策提供更多的信息,从而提高了决策总体结果的准确率,目的是建立能够处理和关联来自多种模态信息的模型,是典型的多学科交叉领域,并已逐步成为研究热点。





遥感图像分析(Remote sensing image analysis)




遥感图像分析的主要目的是根据图像所包含的光谱信息、空间信息、多时相信息和辅助数据,分析地面物景中对应的物体类别、性质及其变化,例如农作物类别、林区林种、农林虫害、泛区面积、矿山岩性、土壤成分和城镇变迁等。遥感图像分析技术在地理学、国土科学、生态学等众多领域得到了广泛的研究与应用。









模糊检测与去模糊(Deblurring)



造成图像模糊的原因有很多,其中包括光学因素、大气因素、人工因素、技术因素等等,日常生产生活中对图像进行去模糊操作有其重要意义。从原理上,模糊图像一般被看作由清晰图像卷积模糊核得到,正确估计模糊核非常关键。模糊核估计方法很多,包括:单独估计,最小均方误差估计,最大后验估计等。基于深度学习的模糊检测与去模糊技术是目前主流方法。