刘颖莹
- 作品数:3 被引量:16H指数:2
- 供职机构:山东师范大学信息科学与工程学院更多>>
- 发文基金:山东省社会科学规划研究项目山东省高等学校科技计划项目教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于密度峰值发现的文本聚类算法被引量:10
- 2016年
- 提出一种基于密度峰值发现的文本聚类算法,将文本的距离与密度计算转化为文本向量的相似度计算,实现基于密度峰值发现的文本聚类算法。该算法采用空间向量模型表示文本,用余弦公式进行相似度计算,然后求得每个文本的密度和距离。剔除噪音点后,选取聚类中心,将剩下的非中心点划分到距离其最近的聚类中心所在的类簇中去。通过多组对比试验,验证了本方法的可靠性和鲁棒性。
- 刘颖莹刘培玉王智昊李情情朱振方
- 关键词:文本聚类向量距离
- 基于密度的聚类算法及在新闻话题发现中的应用研究
- 伴随着互联网新兴媒体的出现,信息传播手段日益进步,我们逐步摆脱了信息获取渠道和内容的局限,但是这同时又带来了信息过载、传播失控等伴随问题。人们每天都接触着海量的新闻话题,其中相当一部分话题是人们不感兴趣的,如何进行精准有...
- 刘颖莹
- 关键词:新闻话题聚类算法文本信息
- 基于特定用户角色的热度计算方法及应用被引量:5
- 2016年
- 针对现有热度值计算方法计算结果不准确的问题,提出一种改进的热度值计算方法。在综合考虑发布者、关注度、时间、转发数和评论数等因素的前提下,通过设置个人认证用户和非个人认证用户等特定用户的权重来计算话题的热度,对热度值计算公式进行改进。实验结果表明,该方法能够有效对微博热点话题进行检测,实现对微博热点事件的监控和管理。
- 李情情鲁燃朱振方刘颖莹