王文剑 作品数:267 被引量:921 H指数:14 供职机构: 山西大学 更多>> 发文基金: 国家自然科学基金 山西省回国留学人员科研经费资助项目 山西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 经济管理 更多>>
基于主动−被动增量集成的概念漂移适应方法 2025年 数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理不同类型的概念漂移,从而避免模型泛化性能下降.针对这一问题,提出一种基于主动–被动增量集成的概念漂移适应方法(CDAM-APIE).该方法首先使用在线增量集成策略构建被动集成模型,对新样本进行实时预测以动态更新基模型权重,有利于快速响应数据分布的瞬时变化,并增强模型适应概念漂移的能力.在此基础上,利用增量学习和概念漂移检测技术构建主动基模型,提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能.实验结果表明,CDAMAPIE能够对概念漂移做出及时响应,同时有效提高模型的泛化性能. 祁晓博 陈佳明 史颖 亓慧 史颖 亓慧关键词:概念漂移 数据流分类 基于时序核函数的支持向量回归机 被引量:4 2006年 为克服维数灾难和过拟合等传统算法所不可规避的问题,利用支持向量机(SupportVectorMachine,SVM)提出基于时序数据时间相关性的核函数修正选择方法,并以真实的二氧化硫(SO2)数据为实验数据验证该方法的有效性.实验结果表明采用时序核函数对测试数据集的拟合效果更好,并对模型泛化能力有一定的提高. 王平 王文剑关键词:支持向量机 支持向量回归 核函数 时序数据 基于在线性能测试的概念漂移检测方法 被引量:14 2020年 概念漂移是动态流数据挖掘中一类常见的问题,但混杂噪声或训练样本规模过小而产生的伪概念漂移会引起与真实概念漂移相似的结果,即模型在线测试性能的不稳定波动,导致二者容易混淆,发生概念漂移的误报.针对流数据中真伪概念漂移的混淆问题,提出一种基于在线性能测试的概念漂移检测方法(concept drift detection method based on online performance test,简称CDPT).该方法将最新获得的数据集进行均匀分组,在每组子数据集上分别进行在线学习,同时记录每组子数据集训练测试得到的分类精度向量,并计算相邻学习时间单元之间的精度落差,依据测试精度下降阈值得到有效波动位点.然后采用交叉检验的方式整合不同分组中的有效波动位点,以消除流数据在线学习过程中由于训练样本过小导致模型不稳定造成的检测干扰,根据精度波动一致性得到一致波动位点.最后,通过跟踪在线学习分类准确率,得到一致波动位点邻域参照点的测试精度变化,比较一致波动位点邻域参照点对应的模型测试精度下降幅度及收敛情况,以有效检测一致波动位点当中真实的概念漂移位点.实验结果表明,该方法能够有效辨识流数据在线学习过程中发生的真实概念漂移,并能有效避免训练样本过小或者流数据中噪声对检测结果的负面影响,同时提高模型的泛化性能. 郭虎升 张爱娟 王文剑关键词:流数据 概念漂移 一种核的上下文多臂赌博机推荐算法 被引量:3 2022年 个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不是很高。本文针对LinUCB算法推荐准确率不高这一问题,提出了一种改进算法K-UCB(kernel upper confidence bound)。该算法突破了LinUCB算法中不合理的线性假设前提,利用核方法拟合预测收益与上下文间的非线性关系,得到了一种新的在非线性数据下计算预测收益置信区间上界的方法,以解决推荐过程中的探索–利用困境。实验表明,本文提出的K-UCB算法相比其他基于多臂赌博机推荐算法有更高的点击率(click-through rate,CTR),能更好地适应变化场景下个性化推荐的需求。 王鼎 门昌骞 王文剑关键词:个性化推荐 核方法 点击率 融合边缘增强与多尺度注意力的皮肤病变分割 被引量:1 2023年 皮肤病变形状、颜色、大小类型多样,给皮肤病变的准确分割带来了巨大挑战。针对这一问题,提出了一种融合边缘增强与多尺度注意力的皮肤病变分割网络(BEMA U-Net)。该网络包含一个用于提取全局特征的空间多尺度注意力模块和一个用于增强病变区域边缘特征的边缘增强模块,将两种模块添加到以编码解码结构为主干的网络(U-Net)中,能够有效抑制病变图像中背景噪声的干扰并强化病灶的边缘细节。此外,设计了混合损失函数,结合Dice Loss和Boundary Loss,并在训练过程中实现混合损失函数的动态权重调整,使网络对病变图像整体特征和边缘细节特征的提取进行多重监督,缓解了皮肤病变图像分割中毛发干扰和边缘模糊的问题。在ISIC2017和ISIC2018两个公开数据集上的实验结果表明,所提算法对皮肤病变部位的分割图像边缘连续、轮廓清晰,具有更好的分割效果。 白雪飞 靳智超 王文剑 马亚楠一个通用试题库管理系统的设计与实现 被引量:6 1997年 通用试题库管理系统是CAI(计算机辅助教学)的一个重要分支.本文介绍了在FOXPROFORWINDOWS下开发的能够对图文进行统一管理的通用试题库管理系统,利用本系统可以为任意学科建立选题随机性强、成卷速度快、操作灵活方便的试题库系统,并可对其进行管理。 王文剑 曹焕光 李跃琴关键词:试题库 试卷生成 CAI 关于支撑向量机若干问题的研究及应用 王文剑关键词:支撑向量机 一种面向牙医椅的Kinect手势识别装置 本实用新型公开了一种面向牙医椅的Kinect手势识别装置,该装置将体感设备Kinect与计算机相连接,实现了基于Kinect的牙医手势识别;将单片机与嵌入牙医椅中的步进电机相连接,实现了基于单片机的牙医椅无接触式操作;整... 王文剑 白雪飞 史泽宇 成景文 王瑞芳 王淑华文献传递 一种电商网络异常用户检测方法及系统 本发明涉及电商平台的网络安全领域,为了消除这些异常用户所带来的负面影响,公开了一种电商网络异常用户检测方法及系统。所述系统包括计算机处理器和内存、电商网络数据预处理单元、电商网络异常用户检测模型训练单元、电商网络异常用户... 杜航原 李铎 王文剑基于半监督网络表示学习的电商网络社区发现方法及系统 本发明涉及电商网络数据挖掘领域,公开了一种基于半监督网络表示学习的电商网络社区发现方法及系统,所述方法包括电商网络邻接矩阵、特征矩阵以及部分用户标签矩阵构建环节,半监督网络表示学习的电商网络社区发现模型构建及优化环节,半... 杜航原 谢富中 王文剑 白亮 梁吉业