山西大学计算机与信息技术学院计算智能与中文信息处理教育部重点实验室 作品数:575 被引量:2,500 H指数:20 相关作者: 侯岩 张贵生 钱字华 张佳乐 李瑞萍 更多>> 相关机构: 山西财经大学财政金融学院 太原科技大学计算机科学与技术学院 山西财经大学信息管理学院 更多>> 发文基金: 国家自然科学基金 山西省自然科学基金 山西省回国留学人员科研经费资助项目 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 社会学 更多>>
数字化时代背景下的数据库课程教学改革 被引量:2 2024年 基于数字化时代计算机类课程带来的新挑战和变革,分析数据库课程教学改革研究现状,提出数字化时代数据库课程教学改革思路,介绍具体教学改革过程,最后说明教学改革效果,以期对计算机类课程改革和优化提供一定的参考。 王元龙 庞继芳 张虎 李茹关键词:数据库课程 教学改革 形式概念分析的逆向研究 被引量:1 2014年 指出了形式概念分析(formal concept analysis,FCA)的另一研究方向——逆向研究。与经典研究方法最大的不同在于逆向研究始于蕴涵,而非形式背景。一般过程为:首先由领域知识得到一个蕴涵集合;其次根据蕴涵集合得到形式背景、内涵集及概念格;最后可以参考形式背景对领域知识进行验证或者补充,还可以依据领域特点,由得到的形式背景通过选用不同的梯级方式来得到多个多值背景,并使用得到的多值背景来对领域知识进行验证或者补充。据此,定义了逆向研究的两个基本概念:协调和关联,得出了蕴涵协调形式背景的充要条件和蕴涵关联形式背景的充要条件。 翟岩慧 李德玉 曲开社基于汉语框架网的旅游信息问答系统设计 被引量:14 2009年 该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结合的方式为查询问句分类,然后提出基于CFN的问句分析策略,通过CFN语义分析得到问句中三元组:语义谓词、语义主体和语义客体,在问句分析的基础上从旅游本体知识库中对答案进行抽取并对答案处理,同时用本体编辑工具Protégé编码,实验证实方法是有效的。 李茹 王文晶 梁吉业 宋小香 刘海静 由丽萍关键词:计算机应用 中文信息处理 本体 问答系统 基于K-Means聚类的瓦斯浓度预测 被引量:9 2011年 提出一种基于K-Means聚类的非线性时间序列预测模型。利用混沌时间序列短期可以预测的特点,对选取的某两处煤矿构建了瓦斯浓度预测模型。采用关联积分方法确定相空间时间延迟τ和相空间嵌入维数m。然后在重构相空间中,运用基于K-Means聚类的加权一阶局域法构建煤矿瓦斯浓度的预测模型。结果表明:在预测间隔1 min的数据时,使用200个连续的数据进行训练,预测效果较好,误差达到最小值0.0341;在预测间隔多分钟的数据时,使用200个15 min间隔的数据进行训练,预测效果较好,误差达到最小值0.0437,可见该瓦斯浓度时序在间隔15 min后又恢复了初始的混沌性。 穆文瑜 李茹关键词:瓦斯浓度 相空间 基于时序窗口的概念漂移类别检测 被引量:11 2022年 流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window,CD-TW)方法.该方法借助栈和队列对流数据进行存取,借助窗口机制对流数据进行分块学习.首先创建2个分别加载历史数据和当前数据的基础节点时序窗口,通过比较二者所包含数据的分布变化情况来检测概念漂移节点.然后创建加载漂移节点后部分数据的跨度时序窗口,通过分析该窗口中数据分布的稳定性检测漂移跨度,进而判断概念漂移类别.实验结果表明该方法不仅能够精确定位概念漂移节点,同时在漂移类别判断方面也表现出良好性能. 郭虎升 任巧燕 王文剑关键词:流数据 概念漂移 概率语言环境下基于多粒度决策粗糙集和MABAC法的光伏发电效能评价 2024年 本文为应对概率语言环境下多粒度决策粗糙集在信息融合方面的局限,结合MABAC(Multi-Attributive Border Approximation Area Comparison)法建立了多粒度概率语言三支群决策方法.首先,本文将概率语言术语集与多粒度决策粗糙集相结合,提出多粒度概率语言决策粗糙集模型;其次,本文利用FUCOM(Full Consistency Method)求解属性权重,在三支决策的框架下计算阈值,将MABAC法与多粒度三支群决策模型进行融合,对计算出的各个阈值进行最优粒度选择来获得最终阈值;再次,本文建立多粒度概率语言三支群决策方法,通过此模型求解出最优方案;最后,本文通过光伏发电效能评价的实例验证所建立方法的可行性. 温琦菲 张超 李德玉 李德玉 王日中关键词:多粒度 特征选择:一种面向数据取值更新的批处理机制 被引量:7 2017年 实际应用中获取到的数据通常是动态更新的,且随着数据观测工具的快速发展,数据库中数据更新的速度也越来越快,同一时刻更新的规模也越来越大.面向动态数据集的数据挖掘研究中,数据库中数据取值的动态更新也是一种数据集动态变化的类型.特征选择是一种有效的数据预处理工具,面向数据取值动态更新的特征选择方法也已经引起了众多研究者的广泛关注.为此,基于粗糙集理论和信息熵的概念,提出一种面向数据取值动态变化数据集的特征选择方法,可一次处理一组取值发生变化的数据.算法中首先分析了信息熵随数据取值动态变化的更新机制,以信息熵作为特征重要度的度量,设计了基于信息熵的粗糙特征选择算法.实验结果进一步验证了新算法的可行性和高效性. 张娇鹏 王锋 梁吉业关键词:粗糙集 信息熵 在线深度神经网络的弱监督概念漂移检测方法 2024年 流数据作为大数据的重要形式广泛存在于实际问题中,由于流数据中数据分布变化产生概念漂移,容易导致模型的泛化性能下降,且在实际应用问题中,数据标记成本较高,难以获得强监督的信息.针对以上问题,本文提出一种基于在线深度神经网络的弱监督概念漂移检测(Weakly supervised conceptual drift detection method based on online deep neural network,WSCDD)方法.该方法设计了一种在线深度神经网络模型,采用Hedge反向传播方法在线学习网络深度,并通过设计Dropout层在模型预测时引入随机性,利用蒙特卡罗方法量化深度神经网络模型的预测不确定性,通过自适应滑动窗口技术检测弱监督环境下概念漂移的发生,并使模型适应新的概念.实验结果表明,该方法可以准确检测数据流中概念漂移的发生,在漂移发生后能够快速收敛到新的数据分布,提高了学习模型的泛化性能. 马乾骏 郭虎升 王文剑关键词:流数据 概念漂移 蒙特卡罗方法 保持决策蕴涵不变的决策背景属性约简 2024年 形式概念分析是一种利用概念格进行数据分析的理论,属性约简是概念格约简的主要方式之一。决策蕴涵是形式概念分析在决策情形下的一种知识表示与推理模型。在已有保持决策背景知识信息不变的属性约简研究中,通常以保持概念规则或粒规则来保持决策背景的知识信息。而相比于概念规则与粒规则,决策蕴涵具备更强的知识表示能力。为了进一步缩小数据在属性约简前后对知识信息表示的差异,对保持决策蕴涵不变的属性约简进行了研究。首先,结合决策蕴涵的语义给出了保持决策蕴涵不变的协调集和约简定义,提出了判定协调集和约简的充要条件;接着,通过实例分析了该约简存在的问题,并结合蕴涵理论给出解决方法,从而给出了弱协调集和弱约简的定义;然后,从知识包含的角度分析了弱约简相比于约简的合理性;最后,提出了判定弱协调集和弱约简的充要条件,并结合决策蕴涵规范基给出了能够找到弱约简的方法,丰富了保持知识信息的属性约简研究内容。 毕盛 翟岩慧 李德玉关键词:形式概念分析 属性约简 知识表示模型 面向复杂网络的节点相似性度量 被引量:3 2020年 在复杂网络中,度量节点之间的相似性是一项基础且具有挑战性的工作。基于邻域节点的相似性度量仅考虑了节点的邻域信息。基于路径的相似性度量考虑了节点之间的路径信息,使得多数节点与大度节点相似。为了更准确地度量节点之间的相似性且避免多数节点与大度节点相似,定义了每个节点的距离分布,并在此基础上采用相对熵和距离分布提出了一种节点相似性度量方法(DDRE)。DDRE方法通过节点之间的最短路径生成每个节点的距离分布,根据距离分布计算节点之间的相对熵,进而得到节点之间的相似性。6个真实网络数据集的对比实验结果表明,DDRE方法在对称性以及SIR模型中影响其他节点的能力这两方面表现较好。 穆俊芳 梁吉业 郑文萍 刘韶倩 王杰关键词:复杂网络 相对熵