裴超
- 作品数:2 被引量:14H指数:1
- 供职机构:北京信息科技大学计算机学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于改进的LDA主题模型的微博用户聚类研究被引量:13
- 2016年
- 大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-means算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-means聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
- 裴超肖诗斌江敏
- 关键词:主题模型文本聚类K均值算法
- 基于用户行为的微博转发兴趣分类研究被引量:1
- 2015年
- 以新浪微博为例,通过对微博转发以及评论的倾向性进行预测,研究微博中用户的转发和评论行为。针对转发与评论相结合的特征,利用特征加权模型结合统计学习中的方法,同时结合微博用户的行为,提出一种基于用户行为的特征加权预测模型,不仅提高了预测用户的转发行为,同时能够通过转发内容对微博用户的倾向性有明确的界定。增强了微博重要性评价的依据。实验结果表明,引用的基于用户加权模型的方法一定程度上提高了预测用户转发微博的准确率。
- 裴超肖诗斌江敏
- 关键词:转发用户行为