您的位置: 专家智库 > >

申爱丽

作品数:1 被引量:10H指数:1
供职机构:西北农林科技大学信息工程学院更多>>
发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据仓库
  • 1篇数据挖掘
  • 1篇分布式
  • 1篇分布式数据
  • 1篇分布式数据仓...
  • 1篇RDB
  • 1篇GAC
  • 1篇HADOOP
  • 1篇HBASE

机构

  • 1篇西北农林科技...

作者

  • 1篇李梅
  • 1篇张阳
  • 1篇李伟卫
  • 1篇申爱丽

传媒

  • 1篇计算机应用研...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
基于分布式数据仓库的分类分析研究被引量:10
2013年
针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台的运行策略,使用原生HiveQL语言提出了一种分布式GAC-RDB分类算法。实验显示,随着集群中节点的不断增加,算法的运行时间稳步下降。结果表明,在保证算法准确率的前提下,分布式数据仓库能够有效提高GACRDB分类算法的扩展性和运行效率,相对于MapReduce框架,HiveQL语言降低了对数据挖掘从业人员的技术要求,更大程度地减少了算法的开发时间,为挖掘海量数据提供了新的解决方案。
李伟卫李梅张阳申爱丽
关键词:数据挖掘分布式数据仓库HADOOPHBASE
共1页<1>
聚类工具0