任冬伟
- 作品数:7 被引量:14H指数:1
- 供职机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 视觉弱监督学习研究进展被引量:13
- 2022年
- 视觉理解,如物体检测、语义和实例分割以及动作识别等,在人机交互和自动驾驶等领域中有着广泛的应用并发挥着至关重要的作用。近年来,基于全监督学习的深度视觉理解网络取得了显著的性能提升。然而,物体检测、语义和实例分割以及视频动作识别等任务的数据标注往往需要耗费大量的人力和时间成本,已成为限制其广泛应用的一个关键因素。弱监督学习作为一种降低数据标注成本的有效方式,有望对缓解这一问题提供可行的解决方案,因而获得了较多的关注。围绕视觉弱监督学习,本文将以物体检测、语义和实例分割以及动作识别为例综述国内外研究进展,并对其发展方向和应用前景加以讨论分析。在简单回顾通用弱监督学习模型,如多示例学习(multiple instance learning,MIL)和期望—最大化(expectation-maximization,EM)算法的基础上,针对物体检测和定位,从多示例学习、类注意力图机制等方面分别进行总结,并重点回顾了自训练和监督形式转换等方法;针对语义分割任务,根据不同粒度的弱监督形式,如边界框标注、图像级类别标注、线标注或点标注等,对语义分割研究进展进行总结分析,并主要回顾了基于图像级别类别标注和边界框标注的弱监督实例分割方法;针对视频动作识别,从电影脚本、动作序列、视频级类别标签和单帧标签等弱监督形式,对弱监督视频动作识别的模型与算法进行回顾,并讨论了各种弱监督形式在实际应用中的可行性。在此基础上,进一步讨论视觉弱监督学习面临的挑战和发展趋势,旨在为相关研究提供参考。
- 任冬伟王旗龙魏云超孟德宇左旺孟
- 关键词:目标检测
- 《中国图象图形学报》低质图像处理与语义理解专栏简介
- 2024年
- 视频图像是人类获取信息的重要通道,也是大数据时代占比最高的信息载体。当前,图像视频传感装置被广泛使用,成为交通、医疗、安防、质检等应用领域必不可缺的基础设施。在自动驾驶、智慧城市、深海深空探测等开放应用环境中,数字图像的采集受到软硬件制约和不理想拍摄环境的影响,噪声、低分辨率、模糊、雨雾、甚至缺损等低质图像数据大量出现,为图像处理及其语义理解任务带来严峻挑战。
- 胡清华左旺孟张长青任冬伟韩向娣
- 关键词:图像处理低分辨率数字图像
- 面向盲反卷积的模糊核估计与图像复原方法研究
- 随着移动成像设备的快速发展,尤其是智能手机的普及,图像已成为人们感知世界、与外界交换信息的最重要的途径之一。由于复杂的成像环境,如噪声、低光照、物体运动等,加之手持相机本身的不稳定性极易发生抖动,高质量的图像采集往往难以...
- 任冬伟
- 关键词:图像复原盲反卷积
- 基于坐标下降的图像复原方法研究
- 图像复原作为底层视觉问题一直受到广泛关注,已有众多学者提出复原模型及其优化算法来解决该问题。作为目标识别等应用的基础,复原算法的快速有效性是对其基本要求。全变分(TotalVariation,TV)图像复原模型由于其简单...
- 任冬伟
- 关键词:图像复原全变分模型
- 文献传递
- 图像盲去噪系统
- 一种图像盲去噪系统,属于图像去噪技术领域。本发明针对现有图像去噪方法依赖噪声与清晰图像对进行模型的训练,可行性差的问题。其自监督学习模块包括:基于空洞卷积的盲点网络和图像相关的噪声水平估计网络,用于对噪声样本图像集中的噪...
- 武小荷刘铭曹越任冬伟左旺孟
- 文献传递
- 基于模型引导的深度视觉计算模型与方法研究
- 2020年
- 目前,视觉信息作为大数据中最主要的组成部分,以每天近两万亿GB的数据量急剧增长,因此,感知与识别成为人工智能和深度学习等方向研究中亟待突破的核心问题,是当前国际学术竞争最为激烈的新焦点,且在安全监控、影视特效、无人驾驶和智能相机等诸多行业中存在广泛而巨大的需求.其中,在底层视觉中存在退化模型复杂性、多样性和在高层模态中存在不一致的成本获取/标注成本等问题一直是制约深度视觉学习方向发展的瓶颈之一.为此,该项目在深度学习中结合传统机器学习方法和利用现有知识/模型,发展起一套基于模型引导的深度视觉计算理论体系,并分别在图像去噪、超分辨和去模糊等底层任务及跨模态识别、哈希学习等高层视觉任务中取得了突破性进展,对相关领域的发展起到重要的推动作用.
- 张凯任冬伟刘鹏举张宏志林倞左旺孟
- 图像盲去噪系统
- 一种图像盲去噪系统,属于图像去噪技术领域。本发明针对现有图像去噪方法依赖噪声与清晰图像对进行模型的训练,可行性差的问题。其自监督学习模块包括:基于空洞卷积的盲点网络和图像相关的噪声水平估计网络,用于对噪声样本图像集中的噪...
- 武小荷刘铭曹越任冬伟左旺孟
- 文献传递