2025年12月10日
星期三
|
欢迎来到三亚市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
于浩
作品数:
1
被引量:40
H指数:1
供职机构:
中国科学院大学
更多>>
发文基金:
国家高技术研究发展计划
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
崔世起
中国科学院计算技术研究所
刘群
中国科学院计算技术研究所
西野文人
中国科学院大学
孟遥
中国科学院大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
语料
1篇
新词
1篇
垃圾
1篇
大规模语料
1篇
大规模语料库
机构
1篇
中国科学院
1篇
中国科学院研...
1篇
中国科学院大...
作者
1篇
于浩
1篇
孟遥
1篇
西野文人
1篇
刘群
1篇
崔世起
传媒
1篇
计算机研究与...
年份
1篇
2006
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于大规模语料库的新词检测
被引量:40
2006年
自然语言的发展提出了快速跟踪新词的要求.提出了一种基于大规模语料库的新词检测方法,首先在大规模的Internet生语料上进行中文词法切分,然后在分词的基础上进行频度统计得到大量的候选新词.针对二元新词、三元新词、四元新词等的常见模式,用自学习的方法产生3个垃圾词典和一个词缀词典对候选新词进行垃圾过滤,最后使用词性过滤规则和独立词概率技术进一步过滤.据此实现了一个基于Internet的进行在线新词检测的系统,并取得了令人满意的性能.系统已经可以应用到新词检测、术语库建立、热点命名实体统计和词典编纂等领域.
崔世起
刘群
孟遥
于浩
西野文人
关键词:
新词
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张