高兵
- 作品数:3 被引量:4H指数:1
- 供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于网格的聚类方法研究被引量:2
- 2010年
- 已有的聚类算法对于发现任意形状的聚类和处理离群点效果不理想,分析了现有基于网格的聚类算法。使用网格方法的数据分析方法将空间划分为由(超)矩形网格单元组成的网格,然后在网格单元上进行聚类。最后,总结全文并提出基于网格的聚类需要进一步研究的方向。
- 高兵邹启杰
- 关键词:数据挖掘网格聚类
- 基于共享最近邻密度的演化数据流聚类算法被引量:1
- 2014年
- 现有的基于密度的数据流聚类算法难于发现密度不同的簇,难于区分由若干数据对象桥接的簇和离群点.本文提出了一种基于共享最近邻密度的演化数据流聚类算法.在此算法中,基于共享最近邻图定义了共享最近邻密度,结合数据对象被类似的最近邻对象包围的程度和被其周围对象需要的程度这两个环境因素,使聚类结果不受密度变化的影响.定义了数据对象的平均距离和簇密度,以识别离群点和簇间的桥接.设计了滑动窗口模型下数据流更新算法,维护共享最近邻图中簇的更新.理论分析和实验结果验证了算法的聚类效果和聚类质量.
- 高兵张健沛邹启杰
- 关键词:数据流聚类算法最近邻离群点数据挖掘
- 一种基于代表点的分布式数据流聚类算法被引量:1
- 2012年
- 为发现分布式数据流下不同形状的聚簇,提出了一种基于代表点的聚类算法。算法首先在代表点定义的基础上,提出环点的概念以及迭代查找密度相连环点的算法,在此基础上生成远程站点的局部模型;然后在协调站点设计合并局部模型,生成全局聚簇的算法。通过真实数据集与仿真数据集的实验表明,算法使用代表点能够发现不同形状的聚簇并显著降低数据传输量,同时通过测试—更新局部模型算法避免了频繁发送数据。
- 高兵张健沛杨静
- 关键词:分布式数据流数据挖掘聚类代表点