张娟 作品数:29 被引量:124 H指数:6 供职机构: 上海工程技术大学电子电气工程学院 更多>> 发文基金: 国家自然科学基金 上海市地方高校能力建设项目 更多>> 相关领域: 自动化与计算机技术 文化科学 一般工业技术 交通运输工程 更多>>
基于多补丁和多尺度层级聚合网络的快速非均匀图像去雾 被引量:3 2021年 尽管基于卷积神经网络的去雾算法在合成的均匀雾气数据集上已经取得了巨大进展,但在真实的非均匀有雾图像上仍然表现不佳。为了快速有效地去除图像中的非均匀雾气,文中首先提出了一种多补丁和多尺度层级聚合网络结构(Multi-patch and Multi-scale Hierarchical Aggregation Network,MPSHAN),融合了多补丁局部化信息和多尺度全局化信息。其次,提出了层级融合模块(Hierarchical Fusion Module,HFM),既解耦了残差融合以实现更丰富的非线性特征表达,又通过通道注意力机制提升了关键位置的特征融合质量。同时,对层级结构使用扩张卷积获得多尺度信息,增强特征图以优化融合效果。此外,在损失函数中加入频域损失以恢复更好的边缘质量。实验结果表明,所提算法在非均匀雾气图像上具有很好的鲁棒性,1200×1600高分辨率图像的平均处理时间仅有0.044 s,相比其他去雾算法,其在图像去雾效果和运行时间之间实现了更好的平衡。 杨坤 张娟 方志军关键词:多尺度 图像去雾 基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建 被引量:1 2024年 卷积神经网络已在图像超分辨率领域得到广泛应用,Transformer近年来在该类图像处理任务中的扩展更是具有里程碑的意义,然而这些大型网络具有过多的参数量和计算量,其在部署和应用上存在很大局限性。考虑到上述发展现状,提出一种基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建网络,该网络引入了以交错组卷积为主的特征提取模块,对Transformer的多头自注意力机制进行优化,设计了一种稀疏全局注意力机制以增强特征学习能力,并提出了一种多尺度特征重构模块来提高重建效果。实验结果表明:相比其他几种基于深度神经网络的方法,所提方法的PSNR、SSIM、参数量、计算量等性能指标都表现较好。而与基于Transfomer的方法相比,所提方法在PSNR、SSIM指标上平均提高0.03、0.0002,在参数量、计算量、运行时间上平均降低2.66×10^(6)、130×10^(9)、930 ms。 李想 张娟关键词:图像超分辨率 TRANSFORMER 联合语义感知与域适应方法的单目深度估计 被引量:4 2021年 通过域适应技术去解决深度估计问题,在进行域转换时忽略了真实图像和合成图像在语义上的差异。针对此问题,提出了一种语义感知的域适应框架估计深度。使用语义感知去增强域转换的稳定性,此外,还引入平滑损失函数克服在深度估计过程中边界不连续的和梯度消失的问题,优化深度图的质量。为了验证方法的有效性,在常用的数据集上进行实验,实验结果证明了方法的有效性。 詹雁 张娟 金昌基基于改进局部敏感哈希的协同过滤推荐算法 2021年 传统推荐系统中存在用户评分数据高维稀疏、分布不均匀和传统用户相似度计算准确性低等问题,本文提出一种基于改进局部敏感哈希的协同过滤算法。首先利用改进局部敏感哈希算法对用户评分数据进行降维处理并构建索引,并使用相似度修正系数对用户相似度计算做出改进;然后利用索引敏捷切确地计算目标对象的近邻用户集合;之后选择近邻用户聚集的高相似度用户,使用加权算法对目标对象未评分项目进行评定预估。实验结果表明,对于非均匀用户评分数据的高维稀疏问题,该算法不仅能明显缩短近邻用户检索时间,且能有效提高推荐精度。 曹界杰 张娟关键词:推荐系统 协同过滤 基于位置前馈和平均教师的图像描述生成算法 2025年 图像描述生成算法是计算机视觉中的关键环节,旨在从给定的输入图像中预测相关文本信息,以实现对图像内容的准确理解与表达。提出一种借鉴平均教师算法的模型,并采用独特的双分支网络架构。为提升模型准确性与稳定性,在每个分支中引入位置前馈块。在图像特征提取方面,运用对比语言图像预训练(CLIP)方法,以获取图像的多层次特征,从而更好地捕捉图像的语义信息。在描述生成阶段,通过映射网络将图像特征转化为文本信息,进而利用GPT-2技术来提升预测的准确度与语义的连贯性。为验证模型性能,在Microsoft common objects in context(MSCOCO)和Flickr30k等图像描述数据集上进行充分的训练与测试。测试结果显示所提模型在两个数据集上均表现出色,证实其在图像描述生成任务中的高效性与实用性。研究为图像描述生成领域提供了新的思路与方法,具有深远的理论与实践意义。 陈铄 张娟关键词:CLIP 工程认证背景下“算法与数据结构”课程教学改革 2024年 “以学生为中心、以成果为导向,以及持续改进”的理念为满足学生的学习需求和达到毕业要求提供了一个新的指导框架。在这种认证背景下,本项目对“算法与数据结构”课程的教学大纲进行了重新设计和有效实施。通过加强学生应用能力的培养、加强学生实践环节的训练、开展线下和线上相结合的教学方法和建立结果和过程相结合的评价机制等一些举措,进行教学改革,充分体现工程认证的核心内涵,为培养学生的实践动手能力和工程能力、为提高本课程的教学质量、为培养计算机软件开发和软件应用人才做出贡献。 施一萍 张娟 黄勃关键词:工程教育专业认证 算法与数据结构 教学改革 一种结构感知损失的域适应深度估计方法 被引量:1 2020年 针对域适应深度估计方法中域图像间结构差异较大问题,文中提出一种结构感知损失的域适应深度估计方法。该方法通过预训练的卷积神经网络对图像进行特征提取,在特征上进行结构相似性度量,减小了域图像之间的差异性,提高了转换模块的稳定性。该方法使用合成图像深度对和真实图像训练,不需要真实图像的深度标签和物理几何信息。在KITTI数据集上进行实验,深度准确率达到了96.6%,证明该方法可有效提高深度准确率。 詹雁 张娟关键词:图像处理 单目图像 雨天场景下单目图像深度估计与清晰化算法 2023年 场景深度估计在三维重建、自动驾驶等应用中极为重要,目前深度估计缺乏在恶劣天气条件下的应用研究,实际场景表现不佳.本文针对雨天场景进行研究提出了一种联合的场景深度估计和图像去雨算法.其中深度估计网络以Transformer结构作为编码器和解码器主要模块,首先通过对图像块进行重排和线性投影生成嵌入块,减少了下采样的特征损失;接着利用多头自注意力机制在不同尺度提取特征并与解码器通过跳跃连接对局部和整体深度特征进行学习,提高了全局和长距离上下文信息的利用率,在RainCityscapes数据集上的场景深度估计质量优于现有算法.此外本文还将深度图结果作为先验信息,通过深度信息引导全局残差特征融合去雨网络得到无雨图像,在多个公开数据集上相比现有去雨算法的结构相似度(SSIM)和峰值信噪比(PSNR)均有提高. 张家豪 张娟 郎晓奇基于通道注意力和门控循环单元的图像去雨算法 被引量:5 2021年 在计算机视觉领域,雨线或者雨滴会使雨天拍摄的图像变得模糊,降低图像的质量。针对雨天图像质量低下的问题,提出了一种基于通道注意力和门控循环单元的图像去雨算法。该算法基本思路如下:首先将训练图像通过残差记忆模块提取特征;其次将提取的特征通过特征增强模块增加感受野,识别不同等级的雨线特征并将其增强,传递给后续的循环网络;最后网络循环过程中,通过门控循环单元块实现不同循环阶段之间的参数共享。实验结果利用客观评价指标和主观视觉效果进行评估,验证了该算法在较为复杂数据集上的有效性。 张焱 张娟 方志军关键词:循环神经网络 基于注意力引导的轻量级图像超分辨率网络 被引量:6 2023年 针对图像超分辨率重建网络因结构冗杂、参数量增加导致的计算量过大、训练时间过长等问题,提出一种注意力引导的轻量级图像超分辨率网络(LAGNet)。LAGNet将随机初始化的自适应权重引入深度残差网络结构,更大限度地利用浅层特征信息。其次,提出注意力引导(AG)模块,该模块使用高效通道注意力(ECA)模块和空间分组增强(SGE)模块双支路并联结构,结合通道间关系和空间位置信息特征,利用注意力引导层动态调整两个分支的权重占比,准确获取高频特征信息。最后,使用全局级联连接,减少网络参数量并加快信息流通速度。使用L1损失函数,在加快收敛速度的同时防止梯度爆炸。在三个基准数据集上的测试结果表明:相比其他网络,LAGNet的峰值信噪比平均提高0.39 dB,模型参数量平均减少24%,加法操作量和乘法操作量平均减少62%;在图像视觉效果上整体更为清晰,细节纹理更自然。 丁子轩 张娟 李想 王新宇关键词:卷积神经网络 超分辨率 数字图像处理 计算机视觉