黎刚
- 作品数:3 被引量:35H指数:1
- 供职机构:重庆大学计算机学院更多>>
- 发文基金:重庆市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 文本分类中词语权重计算方法的改进与应用被引量:34
- 2008年
- 文本的形式化表示一直是信息检索领域关注的基础性问题。向量空间模型(Vector SpaceModel)中的tf.idf文本表示是该领域里得到广泛应用,并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一。但是其IDF的计算,并没有考虑到特征项在类间的分布情况,也没有考虑到在类内分布相对均匀的特征项的权重应该比分布不均匀的要高,应该赋予其较高的权重。用改进的TFIDF选择特征词条、用KNN分类算法和遗传算法训练分类器来验证其有效性,实验表明改进的策略是可行的。
- 熊忠阳黎刚陈小莉陈伟
- 关键词:文本表示向量空间模型TFIDF
- 文本分类中词语权重计算方法的改进及应用
- 互联网的发展和信息技术的进步,带来了信息量的猛增,人们很难在浩瀚的信息中找到真正需要的信息,虽然各种搜索引擎的出现在一定程度上解决了这一问题,但是各种搜索引擎都是简单的看是否包含关键字,这样搜索结果十分庞大,并且不利于用...
- 黎刚
- 关键词:文本分类词语权重计算方法
- 文献传递
- 多异构电信信息集成系统中的动态数据同构与同步技术被引量:1
- 2007年
- 多异构电信信息集成系统涉及到多个不同结构的信息系统数据库之间的数据交换.为了保证数据的一致性,往往需要在某一子系统数据更新时进行动态数据复制,将该子系统数据库的新增数据及时同步到异构集成系统的数据库中.针对这一问题,提出了基于.NET面向对象的数据库编程技术,以实现数据库同构;用Oracle透明网关和SQL Server连接服务器实现异构数据库的同步解决方案.
- 熊忠阳黎刚邓明琳
- 关键词:动态数据透明网关