梁琳琳
- 作品数:6 被引量:30H指数:2
- 供职机构:中国传媒大学文学院更多>>
- 发文基金:中央高校基本科研业务费专项资金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术语言文字社会学经济管理更多>>
- 中国历年《政府工作报告》词汇与社会变迁的计量研究被引量:7
- 2014年
- 词汇对于社会变化具有敏感性,可以用计量的方法,从大规模的语言数据中总结出词汇的统计规时,并通过这种规律来印证社会生活的变迁轨迹,甚至对社会生活或国家大政方针的发展变化进行相对准确的预测。中国历年《政府工作报告》中词汇使用频率的计量也印证了中国自1954年来的社会生活变迁。
- 梁琳琳侯敏何宇茵
- 关键词:词汇《政府工作报告》社会变迁
- 基于情绪因子的中文微博情绪识别与分类被引量:23
- 2014年
- 以情绪因子中的常用情绪词和情绪短语为基础构建情绪词典,并针对特殊的情绪表达形式,结合标点符号和表情符号在情绪分析中的功能,建立情绪规则库。通过对情绪词典和情绪规则的匹配和计算,实现对中文微博情绪的识别和分类,并在2013年CCF第二届自然语言处理与中文计算会议中文微博情绪分析评测中取得较好成绩。测试结果证明该方法有效。
- 张晶朱波梁琳琳侯敏滕永林
- 语料规模与字词计量研究的关系
- 研究是语言研究的一种新范式,随着语料库技术的发展,利用大规模真实文本进行语言研究成为一种趋势。作为研究样本的语料,其规模与计量研究之间的关系却鲜有论及。常用字、常用词是基础性的计量研究,本文以其为切入点,通过语料规模的递...
- 梁琳琳侯敏
- 关键词:常用字常用词
- 话题型微博中的人称代词特征及消解策略
- 2014年
- 通过分析中文话题型微博的文本特点以及人称代词的分布特征,指出该类微博是一种特殊的多人会话文本,其人称代词具有词型较少、各类人称代词使用比重差异较大、用法不规范、常出现泛指与外指等特点,并依据这些特点,提出去伪、特殊命名实体提取、建立话题语用表单、多层面语言信息提取等策略,以及相应的消解方法。实验结果证明该方法可取得较好的效果。
- 张瑛梁琳琳侯敏滕永林
- 关键词:人称代词消解
- 2011年新词语全“体”出动的文化解读
- 2012年
- 以巴赫金的对话理论和狂欢理论为切入点解读2011年度"~体"新词语群,不难发现其所展现的对话性和全民参与的理性狂欢精神。微博平台提供了网民借"体"发挥的大舞台,"~体"新词语体现了一种风格,实现了对社会事件的记录,还展现了对现实真实生活的讽刺揶揄,由此可以反观社会,反观人心。微博作为一种网络社交平台,其舆情价值值得关注和探讨。
- 何宇茵梁琳琳
- 关键词:巴赫金对话性狂欢精神
- 语料规模与常用字词计量研究的关系
- 2013年
- 基于语料库的计量研究是语言研究的新范式。本研究以常用字/词的提取为切入点,通过语料规模的递增实验,探讨了语料规模与常用字/词计量研究间的关系。实验结果表明:1)在语料规模阈值内,语料规模与高频字词基本呈现一种正相关关系;2)以覆盖率90%为标准提取常用字/词时的语料规模阈值分别为200万和6000万;3)达到语料规模阈值以后,语料规模对高频字词的影响微乎其微。
- 梁琳琳侯敏何宇茵
- 关键词:常用字常用词