您的位置: 专家智库 > >

王宏杰

作品数:6 被引量:34H指数:3
供职机构:西南石油大学计算机科学学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术石油与天然气工程更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 6篇自动化与计算...
  • 1篇石油与天然气...

主题

  • 2篇聚类
  • 2篇加权
  • 1篇代价敏感学习
  • 1篇值约简
  • 1篇属性约简
  • 1篇属性值
  • 1篇属性值约简
  • 1篇数据特征
  • 1篇特征加权
  • 1篇推荐系统
  • 1篇钻井
  • 1篇钻井作业
  • 1篇相似度
  • 1篇聚类集成
  • 1篇聚类算法
  • 1篇聚类中心
  • 1篇互信息
  • 1篇加权策略
  • 1篇贡献因子
  • 1篇分类回归树

机构

  • 6篇西南石油大学

作者

  • 6篇王宏杰
  • 2篇闵帆
  • 2篇刘福伦
  • 1篇张林
  • 1篇陈虎

传媒

  • 2篇计算机科学
  • 2篇数码设计
  • 1篇计算机应用
  • 1篇智能系统学报

年份

  • 2篇2018
  • 3篇2017
  • 1篇2016
6 条 记 录,以下是 1-6
排序方式:
邻域覆盖分类的两种加权策略被引量:1
2018年
邻域覆盖粗糙集在机器学习的理论与应用中都起着重要作用。结合覆盖约简和代表选择,已有的研究在符号数据上取得了很好的分类结果;然而,已有方法使用简单投票策略,不能有效解决分类冲突问题。对此提出两种新的加权策略,在分类阶段确定投票的模式。第一种基于Cfs Subset EVal和Best First根据属性重要度加权,第二种基于预测点与代表的Overlap相似度加权。利用加州大学欧文分校(UCI)的10个公开数据集进行实验,并与其他三种常用分类算法进行对比。实验用F-measure值对算法性能进行评定。实验结果表明,两种新策略均能提升分类精度,其中属性加权策略效果更明显。此外,属性加权策略特别适用于对生命领域数据集进行分类。
王轩刘福伦张林王宏杰闵帆
关键词:相似度覆盖约简
结合初始中心优化和特征加权的K-Means聚类算法被引量:19
2017年
为了提高传统K-Means聚类算法的聚类准确性,提出一种结合初始中心优化和特征加权的改进K-Means聚类算法。首先,根据样本特征对聚类的贡献程度获得初始特征权重,构建一种加权距离度量。其次,利用提出的初始聚类中心选择方法获得k个初始聚类中心,并结合初始特征权重进行初步聚类。然后,根据聚类精度来调整特征权重并再次执行聚类过程。重复执行上述过程直到聚类精度不再变化,获得最终的聚类结果。在UCI数据库上的实验结果表明,与现有相关K-Means聚类算法相比,该算法具有较高的聚类准确性。
王宏杰师彦文
关键词:K-MEANS聚类贡献因子特征加权
基于新型不纯度度量的代价敏感随机森林分类器被引量:8
2017年
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器。首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于不同样本的代价差异;其次,执行随机森林算法,对数据集作K次抽样,构建K个基础分类器;然后,基于提出的不纯度度量,通过分类回归树(CART)算法来构建决策树,从而形成决策树森林;最后,随机森林通过投票机制做出数据分类决策。在UCI数据库上进行实验,与传统随机森林和现有的代价敏感随机森林分类器相比,该分类器在分类精度、AUC面积和Kappa系数这3种性能度量上都具有良好的表现。
师彦文王宏杰
关键词:代价敏感学习不平衡数据
SUCE:基于聚类集成的半监督二分类方法被引量:4
2018年
半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚类算法生成大量的弱学习器;利用已有的类标签信息,对弱学习器进行评价和选择;通过集成弱学习器对测试集进行预分类,并将置信度高的样本放入训练集;利用扩展的训练集,使用ID3、Nave Bayes、 kNN、C4.5、OneR、Logistic等基础算法对其他样本进行分类。在UCI数据集上的实验结果表明,当训练样本较少时,本方法能稳定提高多数基础算法的准确性。
闵帆王宏杰刘福伦王轩
关键词:聚类聚类集成
基于互信息分组的名词型数据特征选择方法被引量:2
2017年
属性选择与属性提取是数据挖掘和知识发现领域中的重要预处理技术。本文同时利用这两种技术,提出基于互信息分组的名词型数据处理方案。首先,通过互信息把原始数据集属性分成若干组。然后,每组属性通过笛卡尔集的方式合并成一个新的属性。最后,通过属性值约简,获得新的数据。在四个UCI数据集上的实验结果表明,本方法可以降低属性和属性值个数,并且相比原始数据集在ID3上的分类效果更好。
王宏杰师彦文王轩
关键词:属性约简属性值约简互信息
推荐系统在钻井作业安全检测上的研究及应用
2016年
智慧油田时代对油田各项业务提出了新的要求。通过研究推荐系统,结合机器学习技术,设计并实现一个用于钻井工人作业安全检查的推荐系统。系统基于统计机器学习、K近邻技术对油田工人作业违章数据进行分析、挖掘、预测,从而推荐出最优安全检测顺序。系统通过对油田大数据的清洗、学习,用于钻井工人安全检测作业方面,并通过设计的推荐系统计算出理想的检测顺序,具有一定的现实意义。
敬智杰孙爽博陈虎王宏杰
关键词:推荐系统K近邻安全检测
共1页<1>
聚类工具0