“十一五”国家科技支撑计划(2006BAH03B04)
- 作品数:2 被引量:8H指数:2
- 相关作者:章成志李慧云魏彦婧殷人昆更多>>
- 相关机构:南京理工大学同方知网(北京)技术有限公司中国科学院研究生院更多>>
- 发文基金:“十一五”国家科技支撑计划更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于KNN的科技主题跟踪
- 话题跟踪属于话题识别与跟踪(TDT)的一项子任务,是一种基于事件的信息组织技术。话题跟踪任务就是根据某一话题的训练报道,在后续报道中找出讨论该话题的所有报道。用话题跟踪方法可以解决对已有科技主题的自动跟踪问题。针对科技文...
- 宋丹吴晨薛德军师庆辉
- 关键词:KNN算法
- 文献传递
- 基于词位置与同现特征的中文自动文摘研究
- 在利用统计方法对文摘中词频特征和词位置分布特征进行分析的基础上,提出增加词同现特征用于自动文摘系统的新方法。文中把该方法表示为基于词位置与同现特征的中文自动文摘模型,模型中利用了文本压缩方法对文摘句进行排重,同时借助文摘...
- 耿崇宋丹薛德军张灿
- 关键词:自动文摘
- 文献传递
- 术语同义词的自动抽取
- 术语同义词对的自动发现和识别在文献检索领域有若重要的研究意义和应用价值。本文提出一种在文献中自动抽取同义词的方法,它将问题分为(1)抽取同义词对;(2)确认同义词对足否真正匹配,两步的完成都借助了机器学习的方法。实验证明...
- 宋丹师庆辉薛德军林鸿飞
- 关键词:指代消解
- 文献传递
- 基于引文和内容分析的学科研究热点预测
- 本文提出了一种依据图的“添加有选择性”来预测后续论文最有可能引用哪些现有的文章(热文) 的方法,依据论文与参考文献间的内容相关性,利用主成分分析的方法对热文进行内容分析,进而达到对后续论文中的研究热点进行预测。实验证明这...
- 宋丹师庆辉薛德军林鸿飞
- 关键词:引文分析主成分分析
- 基于海量数据的Web集群的性能分析与测试被引量:3
- 2007年
- 为解决海量数据和Web集群服务的下载配置模型测试问题,通过测试工具选择、测试环境配置、测试用例选择以及测试实施过程,利用性能测试方法,针对一组真实测试实例,得出与现有的单机普通阵列模型相比,采用新的集群模型后,一台高性能的磁盘阵列连接4台服务器,1 300个用户并发下载时,阵列CPU使用率持平在90%的情况下,平均每秒能完成360个文件的下载任务,达到了阵列的最大服务能力,为目前最佳集群下载配置模型。
- 李慧云殷人昆魏彦婧
- 关键词:集群服务器WEB服务海量数据性能分析
- 科技主题识别及表示
- 科技主题用来表征学科的研究关注点,是科技热点的具体承载对象。当前,科技主题获取的自动化程度不高,绝大多数都借鉴专家经验实现。结合自然语言处理领域TDT的研究成果,针对科技文献特征,借助链接分析及文本聚类方法对科技主题进行...
- 吴晨宋丹薛德军师庆辉
- 关键词:主题识别
- 文献传递