许幸
- 作品数:1 被引量:8H指数:1
- 供职机构:广东药学院医药信息工程学院更多>>
- 发文基金:广东省医学科学技术研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于KNN算法的医药信息文本分类系统的研究被引量:8
- 2009年
- 针对目前医药信息文本分类领域的现状,设计并实现了一种基于KNN算法的医药信息文本分类系统。该系统充分利用了向量空间模型在表示方法上的优势和快速KNN算法的特点,并采用逆向最大匹配分词方法进行分词,可有效提高医药信息分类的准确性和信息处理效率。此外,构建了一个医药信息数据集,该数据集包含582篇医药类文本,其中训练文本433篇,测试文本149篇,并在该数据集上对医药信息文本分类系统进行了测试,得到了74.83%的F1值。实验证明,该系统可以较好地实现医药信息文本分类。
- 许幸张启蕊
- 关键词:医药信息文本分类向量空间模型KNN算法