熊振华
- 作品数:2 被引量:3H指数:1
- 供职机构:内蒙古科技大学信息工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于个人微博特征的事件提取研究被引量:3
- 2016年
- 个人微博在事件提取上大多都是运用文本进行相似度计算最终达到聚类结果,而没有充分的考虑到微博特征。针对微博标签、URL、时间等特征,提出一种基于微博特征的事件提取算法。该算法针对微博的特征进行TF-IDF的改进,并加入标签相似度,URL相似度,进行综合相似度计算,最后按时间先分段后合并的改进K-means聚类方法得出事件提取结果。实验结果表明,基于微博特征的事件提取算法对微博关键字提取和事件提取的精确度有明显的提高。
- 高永兵陈超熊振华王宇马占飞
- 基于LDA的专业个人微博事件提取
- 2015年
- 为了自动识别出博主的专业兴趣活动,提出了一种基于LDA的专业个人微博事件提取算法.该算法利用改进的TF-IDF来提取特征词以及采用LDA为语料库建模,以此来挖掘出不同主题和词之间的关系,使得权重较大的词更能反映出微博主题.进一步得到了微博在各主题下的概率分布,并结合时间相似度来计算微博之间的综合相似度,最后通过改进的K-Means聚类并与人工数据作比对.实验结果验证了该算法的有效性,同时表明了该算法可以有结构、有条理的呈现出人们感兴趣的微博事件.
- 高永兵熊振华
- 关键词:LDA相似度