朱杰 作品数:18 被引量:23 H指数:3 供职机构: 河北大学 更多>> 相关领域: 自动化与计算机技术 文化科学 环境科学与工程 经济管理 更多>>
基于邻域采样的多任务图推荐算法 被引量:4 2024年 近年来,图神经网络(GNN)成为解决协同过滤的主流方法之一。它通过构建用户-物品图,模拟用户与物品的交互关系,并用GNN学习它们的特征表示。尽管现有在模型结构上的研究已取得了较大进展,但如何在图结构上更有效地进行负采样仍未有效解决。为此,提出一种基于邻域采样的多任务图推荐算法。该算法提出了一种基于GNN的邻域采样策略,该策略以每个用户为中心构建子图,将次高阶物品作为用户邻域采样的负样本,可以更有效地挖掘强负样本并提高采样质量。通过GNN对图结点进行信息聚合与特征提取,得到结点的最终嵌入表示。设计一种余弦边际损失来过滤部分冗余负样本,以有效减少采样过程中的噪声数据。同时,该算法引入了多任务策略对模型进行联合优化,以增强模型的泛化能力。在3个公开数据集上进行的大量实验表明,该算法在大多数情况下明显优于其他主流算法。 张俊三 肖森 高慧 邵明文 张培颖 朱杰关键词:协同过滤 融入隐式情感和主题增强分布的网络敏感信息深度识别研究 被引量:1 2024年 【目的/意义】网络敏感信息是网络生态治理的重要对象,对其进行精准识别可以有效推动网络空间净化的进程。【方法/过程】为提高网络敏感信息识别性能,提出一种融入隐式情感和主题增强分布的深度识别方法:首先利用提出的IME方法度量敏感词的隐含情感,并将其与信息的原始情感融合获取网络信息的隐式情感特征;然后结合网络敏感信息的特殊性改进BTM模型,并基于改进模型获得网络信息的敏感主题增强分布;最后利用深度学习中的注意力机制将隐式情感特征、敏感主题特征与传统的敏感词特征、语义特征融合,实现对网络敏感信息的识别。【结果/结论】实验结果表明,本文挖掘的隐式情感特征和敏感主题特征均能有效提升网络敏感信息的识别性能,与已有方法相比,多特征融合方法在进行网络敏感信息识别时性能较优。【创新/局限】深入挖掘敏感信息的隐式情感特征和敏感主题特征,融合多种特征实现网络敏感信息的有效识别,为网络生态治理提供理论支撑,但信息中敏感主题的增强分布有待进一步研究。 吴树芳 尹凯 吴汭漩 朱杰关键词:敏感信息 基于二重语义相关性图卷积网络的跨模态检索方法 被引量:4 2024年 随着深度神经网络的不断发展,跨模态检索模型的构建也随之取得了长足的进步。以图卷积网络(GCN)为基础的跨模态检索方法可以较好地捕获数据的语义相关性,因此越来越受到人们的关注。但是,目前大部分研究多将标签之间和样本之间的相关性融入到跨模态表示当中,并没有考虑到标签集合之间的相关性对于跨模态检索模型性能的影响。在多标签场景下,标签集合之间的多标签相关性可以有效地描述对应样本之间的语义关系,因此充分发现多标签相关性并将其融入到跨模态表示中,对于提高跨模态检索模型的性能有着重要的意义。提出了一种基于二重语义相关性图卷积网络(dual semantic correlation graph convolutional networks,DSCGCN)的跨模态检索方法,该方法利用GCN自适应地发现标签之间和多标签之间的语义相关性,并将此二重语义相关性融入到样本公共表示中。此外,还提出了一种多标签相似性损失,用于使生成的样本公共表示相似性更接近于语义相似性。通过在NUS-WIDE、MIRFlickr-25K和MS-COCO三个数据集上的实验可以发现,由于引入了多标签语义相关性,DSCGCN可以获得令人满意的检索效果。 刘佳楠 范晶晶 赵建光 朱杰关键词:语义相关性 融合兴趣主题矩阵和主题生命树的社交用户长短兴趣挖掘 被引量:1 2024年 [目的/意义]针对当前社交用户兴趣挖掘效果不理想,且缺乏对兴趣类型特征的深入研究,提出一种新的长短兴趣挖掘方法。[方法/过程]首先引入兴趣价值参数作为先验知识对Labeled LDA主题模型进行改进,依据改进的主题模型挖掘不同时间窗口的兴趣主题,构建兴趣主题矩阵。然后基于用户兴趣的变化规律构建主题生命树,挖掘用户兴趣的生命特征和潜在关联,将用户兴趣划分为长期兴趣、短期兴趣和过期兴趣。最后依据兴趣主题的强度和波动幅度量化用户不同类型兴趣的权重,实现对用户兴趣的准确表示。[结果/结论]实验采用从新浪微博爬取的真实数据作为训练集和测试集,与已有的兴趣挖掘方法进行比较,结果发现长短兴趣挖掘方法在F1值和MRR值上最高分别提升了7.68%和7.41%。[局限]仅利用微博文本信息对方法进行验证,缺乏对跨平台信息的深入探讨。 吴树芳 高梦蛟 朱杰关键词:主题模型 基于信息互补与交叉注意力的跨模态检索方法 2025年 随着互联网中多模态数据的快速增长,跨模态检索技术受到了广泛关注。然而,现实中一些多模态数据存在语义信息缺失,导致模型难以准确提取出其中蕴涵的语义特征。此外,一些多模态数据还包含了与语义无关的冗余信息,干扰了模型对关键信息的提取。为此,提出了一种基于信息互补与交叉注意力(ICCA)的跨模态检索方法。该方法利用图卷积网络(GCN)建模多标签和数据之间的关系,以补充多模态数据中缺失的语义信息与多标签中缺失的样本细节信息。此外,交叉注意力子模块利用多标签信息,过滤掉数据中语义无关的冗余信息。为了使语义相似的图像和文本在公共表示空间中实现更好的匹配,还提出了一种语义匹配损失。此损失将多标签嵌入融入到图像和文本的匹配过程中,用于进一步增强公共表示的语义性。在NUS-WIDE、MIRFlickr-25K和MS-COCO这三个广泛使用的数据集上进行实验,实验结果表明,ICCA在这些数据集上的平均精度均值(mean average precision,mAP)分别为0.808、0.859和0.837,显著优于现有方法。 王丹 张峰 张辉 朱杰基于混合相关性学习的跨模态哈希检索方法 本发明提供一种基于混合相关性学习的跨模态哈希检索方法。该方法包括:获取待检索数据;将待检索数据输入至训练好的检索模型,得到检索模型输出的与待检索数据对应的哈希码;根据哈希码,从预设的数据库中确定与待检索数据对应的检索结果... 朱杰 师广田一种基于聚类的支持向量机反问题求解算法 支持向量机(SVM)是机器学习领域一种非常重要的分类算法,它的出现是以统计学习理论为基础的。由于其良好的泛化能力,使得这种分类方法在很多领域都有应用。但是时间复杂度高的缺点一直是困扰这种优秀的分类器进一步发展的原因。支持... 朱杰关键词:支持向量机 核聚类算法 K-MEANS聚类算法 时间复杂度 J银行廊坊分行营销策略研究 J银行廊坊分行作为地方性金融机构,面对数字化金融的浪潮,亟需调整和优化营销策略,以适应市场变化并提升竞争力。本研究深入剖析了J银行廊坊分行面对的营销挑战与机遇,旨在为银行制定有效的营销策略提供理论支持和实践指导。 本研... 朱杰关键词:银行业 市场营销 莠去津对中华绒螯蟹生精细胞DNA和减数分裂的影响 莠去津(Atrazine)是常用的一种三嗪类除草剂,同时也是一种被世界公认的环境内分泌干扰物。近年来发现大量莠去津通过各种途径被释放并且进入地表和地下水中造成水体污染。有研究表明莠去津能够对多种动物发育产生影响。中华绒螯... 朱杰关键词:莠去津 中华绒螯蟹 生精细胞 Γ-H2AX 细胞死亡 减数分裂 文献传递 基于两层异质网络的社交短文本扩展研究 2024年 【目的】为了解决社交短文本碎片化、网络用语化的问题,利用社交网络中的异质关系实现对社交短文本的扩展。【方法】基于离散度度量社交信息中热点词的不均匀度,以此改进TF-IDF方法,获取初始特征;依据社交网络中的异质关系,构建包括三个子网络的两层异质社交网络,量化网络中用户的重要程度、文本相似度以及用户对社交文本的认可度,获得多源扩展源,实现对社交短文本的扩展。【结果】与已有社交短文本扩展方法相比,所提方法在准确率、召回率、F1值上最高分别提升了约13%、19%、18%。【局限】未考虑间接关系对异质社交网络构建的影响。【结论】利用社交网络中的异质关系能获得更为合理的扩展源,有效扩展社交短文本。 吴树芳 王宏彬 朱杰 陈婷