2025年11月21日
星期五
|
欢迎来到三亚市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
徐宏博
作品数:
1
被引量:0
H指数:0
供职机构:
河南理工大学计算机科学与技术学院
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
孟令军
河南理工大学计算机科学与技术学...
赵文涛
河南理工大学计算机科学与技术学...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
MAPRED...
机构
1篇
河南理工大学
作者
1篇
赵文涛
1篇
孟令军
1篇
徐宏博
传媒
1篇
电脑知识与技...
年份
1篇
2016
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种基于MapReduce的改进文本输入方式的并行分词方法研究
2016年
中文分词方法都属于串行分词方法,不能处理海量数据。提出一种基于M印Reduce的并行分词方法。Mapreduce程模型默认使用TextI印utFomat文本输入方式,该方式不适合处理大量文本文件。首先基于CombineFilelnputFormat类,自定义文本输入方式MylnputFormat,并在实现createRecordReader方法过程中返回RecordReader对象。其次自定义MyReeordReader类来说明读取文本〈key,value〉键值对的具体逻辑。最后自定义MapReduce函数实现不同类别文本的分词结果。实验证明,基于改进后的MylnputFormat文本输入方式比默认的TextlnputFormat输入方式,更能处理大量文本文件。
徐宏博
赵文涛
孟令军
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张