2025年12月13日
星期六
|
欢迎来到三亚市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
袁威
作品数:
1
被引量:7
H指数:1
供职机构:
江苏大学计算机科学与通信工程学院
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
周小梅
江苏大学计算机科学与通信工程学...
薛安荣
江苏大学计算机科学与通信工程学...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
分布式
1篇
分布式文件
1篇
分布式文件系...
1篇
NUTCH
1篇
HADOOP
机构
1篇
江苏大学
作者
1篇
薛安荣
1篇
周小梅
1篇
袁威
传媒
1篇
无线通信技术
年份
1篇
2014
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于Nutch的分布式爬虫的优化研究
被引量:7
2014年
网络爬虫是互联网运行服务的重要组成部分,并为整个互联网、企业内部网和大型门户网站提供搜索和索引。为解决现有爬虫方法在效率方面的问题,本文介绍了Nutch分布式爬虫工作流程及机制,通过分析Hadoop下的Nutch网络爬虫,在Nutch分布式爬虫的参数方面、Hadoop的I/O模型和Nutch分布式爬虫小文件问题三个方面做了相关优化。实验结果表明,优化后的网络爬虫能更有效的爬取网络资源,能在较大程度上提升网络爬虫效率。
袁威
薛安荣
周小梅
关键词:
NUTCH
HADOOP
分布式文件系统
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张