祁瑞华
- 作品数:68 被引量:196H指数:8
- 供职机构:大连外国语大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论经济管理更多>>
- 移动商务中基于综合评价的推荐信任评估模型被引量:11
- 2010年
- 信任评价是移动商务信任管理中的一个重要问题。本文根据移动商务交易过程中涉及到的各元素结构关系,结合现有移动商务感知信任研究,从移动技术、Wap网站、移动商家和商品、制度环境五个方面多角度地分析移动商务感知信任影响因素,并以此建立移动商家信任度评价指标体系。同时,基于移动商务信任评价特点,构建基于最优推荐计算和ELECTREIII相结合的移动商家信任度评价模型。最后,以实例说明该模型的合理性和有效性。
- 胡润波杨德礼祁瑞华
- 关键词:运筹学推荐信任综合评价信任机制移动商务
- 基于知识库的图书评论主题抽取研究被引量:3
- 2019年
- 【目的】尝试在图书评论主题抽取中引入自然语言语义信息。【方法】将常识知识库的全局语义信息应用到图书评论主题词发现和主题聚类任务中,自动抽取评论中的显性主题词和隐性主题词。【结果】实验结果表明:与双向传播算法相比,基于知识库方法抽取结果的句覆盖率高出30.8%,主题词汇多样性高出0.36%。以此为基础绘制主题词共词聚类图谱,结合知识网络中的节点中心度呈现各个类簇中的关键主题词。【局限】由于目前没有成熟的图书评论领域知识库,本文主题挖掘过程未引入领域知识,还未达到最理想效果。【结论】基于知识库方法有助于提高图书评论主题抽取的句子覆盖率和主题词汇多样性。
- 祁瑞华周俊艺郭旭刘彩虹
- 关键词:知识库图书评论主题抽取
- 俄语多模态情感语料库的构建及应用被引量:11
- 2021年
- 俄语的多模态情感分析技术是情感分析领域的研究热点,它可以通过文本、语音和图像等丰富信息自动分析和识别情感,有助于及时了解俄语区民众和国家的舆论热点。但目前俄语的多模态情感语料库还较少,因而制约了俄语情感分析技术的进一步发展。针对该问题,在分析多模态情感语料库的相关研究及情感分类方法的基础上,首先制定了一套科学完整的标注体系,标注内容包括话语、时空和情感3个部分的11项信息;然后在语料库的整个建设和质量监控过程中,遵循情感主体原则和情感连续性原则,拟订出操作性较强的标注规范,进而构建出规模较大的俄语多模态情感语料库;最后探讨了语料库在解析情感表达特点、分析人物性格特征和构造情感识别模型等多个方面的应用。
- 徐琳宏刘鑫原伟祁瑞华
- 关键词:多模态情感分析语料库俄语
- 计算机基础课分层次教学的探索与实践被引量:14
- 2008年
- 目前大学计算机基础课程面临着教学内容与中小学信息技术课程重合和学生学习差异扩大的问题,应基于最近发展区理论和人本主义学习理论提出大学计算机基础课程分层次教学改革的目标,分析教学改革主要内容和实施的主要步骤。
- 祁瑞华
- 关键词:计算机基础课程分层次教学
- 基于放松区间优势的不完整数据分类
- 2011年
- 针对朴素信念不完整数据分类算法中保守推理规则过于严格导致明确分类样本比例下降的的情况,定义了放松的区间优势,并提出了基于放松区间优势的不完整数据分类模型,与朴素贝叶斯分类和朴素信念分类算法的对比实验结果表明本文提出的分类模型有效地提高了明确分类样本比例,在明确分类样本上的正确率优于朴素贝叶斯分类,与朴素信念分类相当。此外还以文体风格识别作为应用背景进行了实证研究,对比实验结果进一步表明对于文体风格识别数据集,放松区间优势的朴素信念分类算法具有较理想的综合性能。
- 祁瑞华杨德礼
- 关键词:不完整数据
- 基于名词掩盖的跨领域作者识别研究
- 2023年
- 为了提高作者识别的跨领域鲁棒性,解决作者写作规律在不同领域间的迁移问题,该文首先通过分析和实验发现:名词具有较高的领域相关性。然后,采用文本变形算法将名词掩盖掉,以此来降低相关特征的权重,从而迫使机器学习算法选择领域关联度更低的特征拟合样本,进而提高模型的泛化能力。在由21953个样本组成的跨领域作者识别的实验中,该文分别采用了基于字N-gram、基于BERT和基于集成学习的三种典型作者识别方法,对比了无掩盖和掩盖名词、形容词、动词、副词、功能词的作者识别,其中掩盖名词后的作者识别方法获得了较高的评价指标。实验结果表明,掩盖名词的方法可以提高作者识别的跨领域鲁棒性。
- 郭旭祁瑞华
- 两阶段半监督加权朴素信念分类模型
- 2011年
- 针对目前半监督分类算法中未考虑缺失属性隐含信息和算法复杂度高的情况,改进了朴素信念分类,提出了两阶段半监督加权朴素信念分类模型。与直推支持向量机对比实验结果表明两阶段半监督加权朴素信念分类模型减少了分类时间,并且在其能够明确分类的样本上的正确率与直推支持向量机相当,是一种有效的不完整数据分类算法。
- 祁瑞华杨德礼李慧芬
- 关键词:模式识别加权
- 新冠肺炎疫情相关政策扩散特征与主题挖掘研究被引量:6
- 2021年
- [目的/意义]新型冠状病毒肺炎疫情期间,我国政府出台的各类政策在疫情防控、国家调整等方面发挥着重要作用,本文通过研究新冠肺炎疫情相关政策的扩散特征和热点主题,从时间和内容两个方面探寻重大公共卫生事件下,政府政策的扩散机制和主题特点,为智库等相关研究机构研究突发事件的相关政策及其时间分布与内容主题的扩散特征提供借鉴和参考。[方法/过程]本文结合政策扩散和主题挖掘理论与方法,对2020年495条政府机构颁布的新冠肺炎疫情有关政策按照政策类型进行分类,采用时间维度研究法、主题词抽取法和社会网络分析法进行扩散特征分析,并挖掘热点主题。[结果/结论]政府颁布的疫情防控政策可分为法律法规、经济调控和文化活动三类,这三类政策从中央到省市级扩散的时间变化呈现明显的先波动后稳定的特征,体现了国家对新冠肺炎疫情的重视和政策调控的高效性。三类政策的中心主题一致,且在政策扩散过程中得到了较好的传递,三类政策主题继承、创新程度存在差异,政策主题均存在着密切关联。
- 祁瑞华付豪
- 关键词:主题挖掘
- 基于多维语义关系的谐音双关语识别模型被引量:2
- 2018年
- 谐音双关语的识别是幽默研究领域的一个重要分支,并逐渐发展为一个新兴的研究领域.本文提出一种基于4个维度特征集的谐音双关语识别模型,其中4个维度包括语义透明度、语义相关度、语音扩展性和语法特征集.语义透明度包括词项统计和语句字符长度两个特征,语法特征集包括人名、大写、时态、词性和位置5个特征.将这4个维度的9个特征加入到二叉判定树中,使用K-Means聚类获取阈值,完成双关语的识别.本文的实验数据来自于SemEval2017任务7的语料,取得了较好的效果, F1值高于参赛队中的第一名,实验证明基于4个维度特征的二叉判定树分类方法在谐音双关语识别中是有效的,并且在多个特征中,语音扩展性和语法特征集的效果比较明显,这也符合谐音双关语识别中语音作用较大的预测.
- 徐琳宏林鸿飞祁瑞华杨亮
- 关键词:情感分析聚类
- 基于BERT-PGN模型的中文新闻文本自动摘要生成被引量:15
- 2021年
- 针对文本自动摘要任务中生成式摘要模型对句子的上下文理解不够充分、生成内容重复的问题,基于BERT和指针生成网络(PGN),提出了一种面向中文新闻文本的生成式摘要模型——BERT-指针生成网络(BERTPGN)。首先,利用BERT预训练语言模型结合多维语义特征获取词向量,从而得到更细粒度的文本上下文表示;然后,通过PGN模型,从词表或原文中抽取单词组成摘要;最后,结合coverage机制来减少重复内容的生成并获取最终的摘要结果。在2017年CCF国际自然语言处理与中文计算会议(NLPCC2017)单文档中文新闻摘要评测数据集上的实验结果表明,与PGN、伴随注意力机制的长短时记忆神经网络(LSTM-attention)等模型相比,结合多维语义特征的BERT-PGN模型对摘要原文的理解更加充分,生成的摘要内容更加丰富,全面且有效地减少重复、冗余内容的生成,Rouge-2和Rouge-4指标分别提升了1.5%和1.2%。
- 谭金源刁宇峰祁瑞华林鸿飞