姜远 作品数:93 被引量:219 H指数:8 供职机构: 南京大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电气工程 轻工技术与工程 电子电信 更多>>
基于模型似然的超1-依赖贝叶斯分类器集成方法 被引量:3 2007年 平均1-依赖贝叶斯分类器(AODE)是一种重要的贝叶斯学习方法,但由于其平等看待各个超1-依赖贝叶斯分类器输出,可能对最终结果造成不好影响.本文将每个超1-依赖贝叶斯分类器看作一个产生式模型,并通过模型似然度量超1-依赖贝叶斯分类器的性能,进而提出基于模型似然的超1-依赖贝叶斯分类器集成方法(LODE).与AODE 相比,LODE 仅增加较少计算量却显著提高分类性能. 李楠 姜远 周志华关键词:数据挖掘 贝叶斯学习 朴素贝叶斯 对Aggregative-Learning算法的分析 2007年 互联网中存在着海量的有用数据,这些数据位于世界各地的各个站点中,由于各个站点之间的通信代价,不可能收集全部站点的所有数据来训练一个全局分类器.但是每个站点都可以使用它自身的数据来训练一个本地分类器. Aggregative-Learning算法通过利用多个站点的本地分类器进行集成从而获得好的泛化能力.从理论上对Aggregative-Learning算法进行分析,并证明了为什么该算法在网络环境中具有良好的性能. 王魏 姜远 周志华关键词:网络环境 一种基于教学模型的协同训练方法 被引量:3 2013年 在很多实际问题中,很容易得到大量未标记数据而较难获取数据的标记;所以半监督学习在过去的10多年中得到了很大的关注.基于不一致性的半监督学习是其中一种十分重要的风范,协同训练是其代表方法.至今为止,大部分协同训练方法在选择未标记示例进行标记时只考虑预测学习器的置信度,而忽视了学习器的需求.受到真实教学系统的启发,提出了一种针对协同训练的教学模型TaLe,其中预测学习器是"教"者,而另一方则为"学"者.进而基于该模型给出了一种新的协同训练方法CoSnT,同时考虑了"教"的置信度和"学"的需求度.实验结果表明CoSnT在收敛效率和泛化性能上都优于标准的协同训练算法. 胡菊花 姜远 周志华关键词:半监督学习 可靠多模态学习综述 被引量:18 2021年 近年来,多模态学习逐步成为机器学习、数据挖掘领域的研究热点之一,并成功地应用于诸多现实场景中,如跨媒介搜索、多语言处理、辅助信息点击率预估等.传统多模态学习方法通常利用模态间的一致性或互补性设计相应的损失函数或正则化项进行联合训练,进而提升单模态及集成的性能.而在开放环境下,受数据缺失及噪声等因素的影响,多模态数据呈现不均衡性.具体表现为单模态信息不充分或缺失,从而导致"模态表示强弱不一致""模态对齐关联不一致"两大挑战,而针对不均衡多模态数据直接利用传统的多模态方法甚至会退化单模态和集成的性能.针对这类问题,可靠多模态学习被提出并进行了广泛研究,系统地总结和分析了目前国内外学者针对可靠多模态学习取得的进展,并对未来研究可能面临的挑战进行展望. 杨杨 詹德川 姜远 熊辉一种基于HDDT集成的多类不平衡学习方法 2011年 在很多真实世界问题中,不同类别的数据样本往往有显著的不平衡性,即大类的样本远多于小类.对类别不平衡样本进行学习,是目前国内外数据挖掘和机器学习领域的研究热点之一.以往对不平衡样本学习的研究主要针对二分类问题进行,由此针对多分类问题,提出一种基于HDDT决策树集成的多类不平衡学习方法.实验表明,该方法可以有效地对多类不平衡问题进行学习. 钱祺 姜远关键词:数据挖掘 一种改进的决策规则生成算法 2003年 将神经网络集成与C4.5Rule方法相结合,提出了一种改进的决策规则生成算法.该算法以神经网络集成作为C4.5Rule学习的前端,利用其产生用于C4.5Rule学习的数据集,在此基础上进行决策规则的生成.在UCI机器学习数据库上的实验结果表明,该算法可以产生泛化能力较强的决策规则. 姜远 陈兆乾 周志华关键词:神经网络 神经网络集成 基于基因表达谱的肿瘤样本分类规则提取 被引量:1 2009年 样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释. 李颖新 姜远 周志华关键词:决策树 基因表达谱 肿瘤 一种基于教学模型的协同训练方法 在很多实际问题中,很容易得到大量未标记数据而较难获取数据的标记;所以半监督学习在过去的十多年中得到了很大的关注。基于不一致性的半监督学习是其中一种十分重要的风范,主要表现为生成多个分类器从而在每一轮中互相对未标记数据进行... 胡菊花 姜远 周志华关键词:半监督学习 置信度 文献传递 一种基于距离度量的移动设备用户动作姿态识别方法 本发明公开一种基于距离度量的移动设备用户动作姿态识别方法,包括训练数据收集步骤,全局模型训练步骤,局部模型适配步骤和识别步骤;首先对于特定的动作姿态利用移动设备内置传感器进行数据收集,收集大量用户的动作数据后训练全局模型... 叶翰嘉 詹德川 姜远 杨嘉祺文献传递 一种基于HDDT集成的多类不平衡学习方法 在很多真实世界问题中,不同类别的数据样本往往有显著的不平衡性,即大类的样本远多于小类。对类别不平衡样本进行学习,是目前国内外数据挖掘和机器学习领域的研究热点之一。以往对不平衡样本学习的研究主要针对二分类问题进行,由此针对... 钱祺 姜远关键词:数据挖掘