吴泳钢
- 作品数:4 被引量:9H指数:2
- 供职机构:郑州大学信息工程学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于多源知识和Ranking SVM的中文微博命名实体链接
- 实体在文本中是承载信息的重要单元,正确分析存在歧义的命名实体,对文本的理解起到关键性作用.本文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本...
- 陈万礼昝红英吴泳钢
- 关键词:中文文本同义词词典支持向量机
- 基于多源知识的中文微博命名实体链接被引量:3
- 2015年
- 命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。
- 昝红英吴泳钢贾玉祥牛桂玲
- 关键词:同义词词典
- 基于多源知识的命名实体链接研究
- 处于大数据时代下,网络信息出现迅猛增长的趋势,互联网日趋发展成为一个信息覆盖面广的共享仓库,与此同时,对信息资源进行准确地理解也变得越来越困难,这是信息时代中一个亟需解决的问题。命名实体在文档中负载着主要的信息,是重要的...
- 吴泳钢
- 关键词:数据管理程序语言
- 文献传递
- 基于多源知识和Ranking SVM的中文微博命名实体链接被引量:7
- 2015年
- 命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体。在NLP&CC20141中文微博实体链接评测数据集上进行了实验,获得了89.40%的平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势。
- 陈万礼昝红英吴泳钢
- 关键词:同义词词典RANKING语义特征