教育部“新世纪优秀人才支持计划”(NCET-08-0836) 作品数:16 被引量:114 H指数:7 相关作者: 程玉虎 王雪松 郝名林 高阳 张依阳 更多>> 相关机构: 中国矿业大学 中国科学院自动化研究所 中国科学院 更多>> 发文基金: 教育部“新世纪优秀人才支持计划” 国家自然科学基金 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种多样性保持的分布估计算法 被引量:17 2010年 针对传统分布估计算法中存在的早熟收敛问题,在讨论种群多样性保持方法和早熟原因的基础上,提出一种多样性保持的分布估计算法(EDA-DP),具体措施包括:根据混沌运动具有的随机性、遍历性、初值敏感性和规律性等特点引入混沌变异算子;根据个体适应度值和种群中各个体之间的距离信息自适应调整变异半径;根据种群中的个体浓度信息生成子代种群.基准测试函数的实验结果表明,EDA-DP能够有效防止早熟收敛,在提高解的精度和加快收敛速度方面均有所改善. 程玉虎 王雪松 郝名林关键词:分布估计算法 多样性 早熟收敛 基于图知识迁移的蚁群算法参数选择 被引量:3 2011年 同时考虑蚁群算法的所有运行参数,提出一种基于图知识迁移的蚁群算法参数选择方法.首先,将包含知识(蚁群算法的运行参数)的源任务映射到一个高维的迁移空间,并通过迁移权值连接不同的源任务,构造一个模型迁移图;然后,扩展模型迁移图使其包含目标任务,并利用图论的知识学习迁移函数;最后,通过最小二乘法自主地给目标任务分配一个优化的运行参数组合.机器人路径规划问题的仿真结果验证了该方法的智能性、快速性与合理性. 王雪松 潘杰 程玉虎关键词:蚁群算法 参数选择 路径规划 一种简洁局部全局一致性学习 被引量:7 2011年 针对局部全局一致性学习(LLGC)算法的分类精度在很大程度上取决于控制参数的合理设置问题,提出一种少参数的简洁局部全局一致性学习(BB-LLGC).简化图上的目标函数,使其不受参数α的影响.另外,在标签传递过程中,仅将未标记样本的标签根据相似度传递给其近邻,而将已标记样本的标签强制填回以确保标签传递源头的准确性.UCI数据集的实验结果表明,与LLGC相比,BB-LLGC不仅控制参数少、使用简单,而且分类精度高、收敛速度快. 王雪松 张晓丽 程玉虎关键词:半监督学习 参数选择 基于随机子空间-正交局部保持投影的支持向量机 被引量:3 2011年 针对高维数、小样本数据分类问题,提出一种基于随机子空间-正交局部保持投影的支持向量机.利用随机子空间方法对原始高维样本的特征空间进行多次随机采样,生成多个具有不同特征子集的基支持向量机(SVM)分类器;利用正交局部保持投影对各基SVM分类器的样本进行特征提取,实现维数约简;然后,利用降维后的样本对各基SVM分类器进行训练;采用贝叶斯求和准则将各基SVM的分类结果进行融合以得到最终的分类结果.典型人脸数据库识别结果验证了本方法的可行性和有效性. 王雪松 高阳 程玉虎关键词:随机子空间 支持向量机 特征提取 基于高斯过程分类器的连续空间强化学习 被引量:11 2009年 如何将强化学习方法推广到大规模或连续空间,是决定强化学习方法能否得到广泛应用的关键.不同于已有的值函数逼近法,把强化学习构建为一个简单的二分类问题,利用分类算法来得到强化学习中的策略,提出一种基于高斯过程分类器的连续状态和连续动作空间强化学习方法.首先将连续动作空间离散化为确定数目的离散动作,然后利用高斯分类器对系统的连续状态-离散动作对进行正负分类,对判定为正类的离散动作按其概率值进行加权求和,进而得到实际作用于系统的连续动作.小船靠岸问题的仿真结果表明所提方法能够有效解决强化学习的连续空间表示问题. 王雪松 张依阳 程玉虎关键词:高斯过程 分类器 基于径向基统计网络的数据流分析模型 2010年 在传统径向基函数网络的基础上,提出一种用于数据流分析的径向基统计网络,采用复合多维高斯函数来拟合输入空间中不同区域的概率密度.基于数理统计方法的径向基统计网络学习算法的时间和空间复杂度,均与输入变量维数和隐层节点个数的乘积成线性关系,而与数据流规模无关,能够满足数据流分析的实时性要求.仿真结果表明,径向基统计网络能够有效解决数据流的回归和分类问题. 程玉虎 刘博 王雪松关键词:数据流 高斯函数 一种支持向量机参数选择的改进分布估计算法 被引量:8 2009年 支持向量机(support vector machine,SVM)的学习性能和泛化能力在很大程度上取决于参数的合理设置.将支持向量机的参数选择问题转化为优化问题,以模型预测均方根误差为评价函数,提出一种引入混沌变异操作的改进分布估计算法(estimation of distribution algorithm,EDA),并将其用于优化求解ε-支持向量机的参数:惩罚因子、不敏感损失系数以及高斯径向基核函数的宽度.由于改进EDA利用混沌运动的随机性和遍历性等特点在解空间内进行优化搜索,能够较好解决传统EDA易于陷入局部极小的缺陷.Chebyshev混沌时间序列预测仿真结果表明:改进EDA是选取SVM参数的有效方法. 王雪松 程玉虎 郝名林关键词:支持向量机 参数选择 分布估计算法 一种多目标优化问题的混合优化算法 被引量:12 2009年 利用分布估计算法(EDA)的全局搜索性能及差分进化(DE)算法的局部优化能力,提出了一种多目标优化问题的混合智能求解方法DE-EDA。DE-EDA的子代个体由两部分构成,一部分按差分进化算法生成,另一部分则是通过对分布估计算法的概率模型进行随机采样生成。利用模拟退火技术在线调整尺度因子Pr,即在进化的初期选择较大的Pr,以保证EDA起主导作用,由EDA引导DE搜索向Pareto前端,增加全局搜索能力,然后在进化的过程中逐渐降低Pr,使得DE逐渐占据主导作用,确保解精确收敛到Pareto前端。通过4组基准函数来测试算法性能,并与NSGA-II和DE算法进行实验比较,结果表明该方法不仅解的多样性和分布性好,而且能够有效提高种群进化的收敛速度,是一种求解多目标优化问题的有效方法。 王雪松 郝名林 程玉虎 李明关键词:多目标优化 差分进化 分布估计算法 PARETO最优解 基于测地高斯基函数的递归最小二乘策略迭代 2009年 在策略迭代结强化学习方法的值函数逼近过程中,基函数的合理选择直接影响方法的性能.为更好地描述环境的拓扑关系,采用测地线距离来替换普通高斯函数中的欧氏距离,提出一种基于测地高斯基函数的策略迭代强化学习方法.首先,基于马尔可夫决策过程抽样得到的样本数据建立环境的图论描述.其次,在图上定义测地高斯基函数,并用基于最短路径快速算法得到的最短路径来逼近测地线距离.然后,假定强化学习系统的状态—动作值函数是给定测地高斯基函数的加权组合,采用递归最小二乘方法对权值进行在线增量式更新.最后,基于估计的值函数进行策略改进.10×10和20×20迷宫问题的仿真结果验证了所提策略迭代方法的有效性. 王雪松 张政 程玉虎 张依阳关键词:策略迭代 递归最小二乘 测地距离 高斯函数 基于状态-动作图测地高斯基的策略迭代强化学习 被引量:6 2011年 在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图论描述;然后,在状态-动作图上定义测地高斯核函数,利用基于近似线性相关的核稀疏方法自动选择测地高斯核的中心;最后,在策略评估阶段利用基于状态-动作图的测地高斯核逼近动作值函数,并基于估计的值函数进行策略改进.10×10格子世界的仿真结果表明,与基于状态图普通高斯基和测地高斯基的策略迭代强化学习方法相比,本文所提方法能以较少的基函数、高精度地逼近具有光滑且不连续特性的动作值函数,从而有效地获得最优策略. 程玉虎 冯涣婷 王雪松关键词:基函数 策略迭代