您的位置: 专家智库 > >

李秋虹

作品数:4 被引量:18H指数:2
供职机构:复旦大学更多>>
发文基金:国家自然科学基金云南省应用基础研究基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 2篇MAPRED...
  • 2篇查询
  • 1篇信息共享
  • 1篇软件开发
  • 1篇时间序列
  • 1篇数据挖掘
  • 1篇数据挖掘技术
  • 1篇索引
  • 1篇自校准
  • 1篇下界
  • 1篇相似性查询
  • 1篇校准
  • 1篇内存
  • 1篇基于索引
  • 1篇管线
  • 1篇分布计算
  • 1篇分布式
  • 1篇分布式计算
  • 1篇分布式计算模...
  • 1篇MAPRED...

机构

  • 4篇复旦大学
  • 1篇广州大学
  • 1篇江南计算技术...
  • 1篇昆明理工大学

作者

  • 4篇李秋虹
  • 2篇汪卫
  • 1篇戴伟
  • 1篇王鹏
  • 1篇李中升
  • 1篇汪洋
  • 1篇王锋
  • 1篇王锋

传媒

  • 2篇计算机工程
  • 1篇天文研究与技...

年份

  • 1篇2020
  • 1篇2019
  • 1篇2016
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
基于Spark的SKA1-MID自校准管线分布计算实现被引量:2
2020年
平方千米阵列(Square Kilometre Array,SKA)科学数据处理产生的数据超出了所有已存在的分布式处理系统的处理能力,如何实现一个分布式执行框架是当前科学数据处理的一个重要研究内容。Spark是一个非常成熟的商业框架,在互联网中被广泛应用,根据平方千米阵列项目进展的要求,重点研究了如何将算法参考库(Algorithm Reference Library,ARL)中的部分管线移植到Spark上执行。对部分实现过程进行了分析讨论,给出了相应的任务流程。最终结果表明,移植后代码生成结果符合预期,Spark能够满足部分分布式数据的要求,但迫切需要解决自身存在的一系列问题。
戴伟汪森李秋虹邓辉梅盈王锋
关键词:SPARK
基于MapReduce的时间序列索引与批量查询技术被引量:4
2019年
针对基于不平衡树的时间序列索引对海量时间序列数据查询性能较差的问题,提出一种基于MapReduce的DB-DSTree索引。利用平衡的时间序列索引DHD作为路由树创建分布式的DSTree,并充分挖掘批量查询中的数据局部性,将相似的查询路由到局部节点上,以改善DSTree索引的非平衡性。实验结果表明,DB-DSTree索引的平衡性和局部性较好,可减少子树的查询范围和磁盘I/O次数,提高查询效率。
陈军晓李中升刘逸敏李秋虹汪卫
关键词:时间序列相似性查询下界MAPREDUCE模型
基于索引的内存相似性连接算法
2016年
在传统的相似性连接算法中,精确计算和分区阶段互相独立,精确计算时需要对每个分区中的所有数据进行两两比较,计算量较大。针对该问题,设计一种新的内存索引——距离树,并在其基础上提出两结构内存相似性连接算法。根据数据的潜在分布将其分发到不同的分区中,保证具有一定相似度的数据对分配在同个或相邻的分区内,同时通过树节点之间的位置信息保存分区阶段的计算结果,使精确计算阶段仅需对每个分区中相邻的叶节点数据进行比较计算。实验结果表明,与TOUCH算法相比,基于距离树的算法可使运行速度提高2倍~3倍,并具有更好的可扩展性。
董明秀王鹏汪洋汪洋李秋虹
关键词:磁盘查询内存索引
基于MapReduce的大规模数据挖掘技术研究
网络技术的快速发展和信息共享系统的大量应用催生了大数据时代的来临,很多传统的基于单机的数据挖掘算法已经无法满足大数据的挖掘需求,如何进行高效的并行的数据挖掘成为当前研究的热点。当前各种计算机应用系统处理的数据规模日渐增长...
李秋虹
关键词:数据挖掘技术软件开发分布式计算模型信息共享
共1页<1>
聚类工具0