您的位置: 专家智库 > >

刘越

作品数:2 被引量:5H指数:1
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家电网公司科技项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇专利

领域

  • 1篇自动化与计算...

主题

  • 2篇电力
  • 2篇前缀
  • 2篇前缀树
  • 1篇电力数据
  • 1篇数据重组
  • 1篇细粒度
  • 1篇OLAP
  • 1篇OLAP系统
  • 1篇查询
  • 1篇查询性能
  • 1篇大数据
  • 1篇SHARK
  • 1篇SPARK

机构

  • 2篇中国科学院
  • 2篇国网浙江省电...
  • 2篇国网信息通信...
  • 1篇国家电网公司
  • 1篇国网辽宁省电...
  • 1篇江苏省电力公...
  • 1篇国网江苏省电...

作者

  • 2篇刘越
  • 2篇刘万涛
  • 1篇洪建光
  • 1篇李彦虎
  • 1篇张明明

传媒

  • 1篇中国科学技术...

年份

  • 2篇2016
2 条 记 录,以下是 1-2
排序方式:
一种电力数据的OLAP系统的索引建立方法和系统
根据上述技术方案可以看出,本申请提供了一种电力数据的OLAP系统的索引建立方法和系统,所述方法根据所述电力数据中的档案类数据建立前缀树;根据所述前缀树的叶节点,对所述电力数据中的用采数据在数据文件中进行重组,在所述数据文...
崔蔚王亚玲刘万涛刘越虎嵩林黄高攀张明明夏飞
文献传递
基于Spark/Shark的电力用采大数据OLAP分析系统被引量:5
2016年
用电信息大数据上的OLAP查询涉及数据量大,具有多表连接操作频繁、SQL结构复杂等特点,传统关系型数据库面对该类应用,表现出可扩展性弱、数据写入吞吐量低与查询效率低等问题.为此设计了一套基于Spark/Shark的电力大数据OLAP分析系统,该系统采用分布式文件系统HDFS保存电力用电信息采集系统的大数据,通过Shark进行前端SQL解析,Spark进行查询计算;然而,原生Shark只支持粗粒度分区,不支持细粒度的索引技术,难以高效地过滤无关数据,影响了查询性能.为克服这一不足,该系统设计了一种基于前缀树的细粒度索引结构TrieIndex,并通过数据重组技术优化了数据在HDFS的分布,提升了Shark的数据过滤能力以及用电信息大数据OLAP分析的性能.真实用电信息采集系统数据与查询的实验结果表明,该系统比关系型数据库的写入速度提升了12倍,比原生Shark的查询效率提升了10倍以上.
王亚玲刘越洪建光崔蔚李彦虎苏伊鹏黄高攀张明明刘万涛
关键词:SPARKOLAP前缀树
共1页<1>
聚类工具0