您的位置: 专家智库 > >

江苏省普通高校研究生科研创新计划项目(CX10B041Z)

作品数:1 被引量:3H指数:1
相关作者:辛洁赵朋朋张广铭鲜学丰崔志明更多>>
相关机构:苏州大学更多>>
发文基金:江苏省普通高校研究生科研创新计划项目江苏省高校自然科学研究项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇虚拟化
  • 1篇虚拟化技术
  • 1篇虚拟机
  • 1篇数据源
  • 1篇数据源发现
  • 1篇DEEP
  • 1篇DEEP_W...
  • 1篇MAPRED...

机构

  • 1篇苏州大学

作者

  • 1篇崔志明
  • 1篇鲜学丰
  • 1篇张广铭
  • 1篇赵朋朋
  • 1篇辛洁

传媒

  • 1篇通信学报

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
基于MapReduce虚拟机的Deep Web数据源发现方法被引量:3
2011年
为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapReduce过程找到Deep Web数据源接口,并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理,有效提高爬虫数据源发现的效率,避免网络及物理资源的浪费,验证了云计算技术在Deep Web数据挖掘方面的可行性。
辛洁崔志明赵朋朋张广铭鲜学丰
关键词:数据源发现MAPREDUCEDEEP虚拟化技术
共1页<1>
聚类工具0