付建文
- 作品数:3 被引量:1H指数:1
- 供职机构:大连理工大学计算机科学与技术学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 信息自适应过滤的效用指标优化方法
- TREC(Text Retrieval Conference)是信息检索领域中最重要的国际会议,文本过滤是TREC的重要任务之一,自适应过滤是过滤任务的最重要的子任务.对TREC指标函数的优化是一个包括优化时机、优化策略...
- 付建文
- 关键词:阈值调整ML
- 文献传递
- 基于概念和关联扩充的文本标题分类机制被引量:1
- 2005年
- 文本分类是处理电子可读文本的重要手段,本文提出了基于标题的文本分类机制.其基本思想是:鉴于文本标题的重要性和简洁性,利用汉语语义分类树寻求概念上的扩充,利用语料库的关联矩阵,进行关联扩充,以丰富标题的语义内涵,从而获取较高精度的文本分类结果.该方法不依赖于汉语分析器和相应的领域知识库,速度较快,应用面较广.
- 郑海林鸿飞杨志豪付建文
- 关键词:文本分类向量空间模型
- 信息自适应过滤的效用指标优化方法
- 2006年
- 自适应过滤是文本检索会议(TREC)过滤任务的重要子任务,也最接近真实的环境。对评测指标的优化是自适应过滤任务中非常重要的研究方向。论文以TREC的评测指标为目标函数,对在阈值调整中的极大似然估计法和局部优化法进行了比较分析,提出了结合极大似然估计法的局部优化方法,克服了采用单一方法的缺点,实验结果表明这个方法对提高过滤性能是有效的。
- 付建文杨志豪林鸿飞
- 关键词:阈值调整