王辉
- 作品数:28 被引量:82H指数:5
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术轻工技术与工程建筑科学文化科学更多>>
- 主动数据仓库规则模型及其相关语法的研究被引量:1
- 2009年
- 主动数据库的简单规则形式不符合主动数据仓库(ADW)的决策特点,而基于ADW的分析规则在交互性、精确性、表达能力和扩展性等方面存在不足。根据ADW规则渐进分析分布决策的特点,结合ECA规则形式,定义了一种主动多维分析规则模型及相应语法(AMAR)作为ADW规则的表述和执行方式。AMAR不仅可以应对ADW规则的诸多挑战,还提供了对立方体、事件、规则、结果之间复杂对应关系的支持,同时具备了更好的可维护性和可执行性。
- 陈凌王辉张广泉
- 关键词:主动数据仓库ECA
- 人体胸围曲线的拟合方法被引量:10
- 2009年
- 针对描点法获取的真实人体胸围的近似曲线,绘制其外接圆顺曲线,并通过比较各个函数的拟合效果,确定以三次多项式函数进行拟合,然后经过修正获得胸围曲线长度和胸宽、胸厚的函数关系,最后通过曲线缩放推算同号型下胸围的长度,为非接触式二维人体图像的自动测量提供围度计算算法。实验证明,采用本文方法拟合出来的函数曲线误差小,基本满足服装设计尺寸误差要求。
- 卢晨王辉尚笑梅张广泉
- 关键词:最小二乘拟合
- 一种不稳定环境下的策略搜索及迁移方法被引量:3
- 2017年
- 强化学习是一种Agent在与环境交互过程中,通过累计奖赏最大化来寻求最优策略的在线学习方法.由于在不稳定环境中,某一时刻的MDP模型在与Agent交互之后就发生了变化,导致基于稳定MDP模型传统的强化学习方法无法完成不稳定环境下的最优策略求解问题.针对不稳定环境下的策略求解问题,利用MDP分布对不稳定环境进行建模,提出一种基于公式集的策略搜索算法——FSPS.FSPS算法在学习过程中搜集所获得的历史样本信息,并对其进行特征信息的提取,利用这些特征信息来构造不同的用于动作选择的公式,采取策略搜索算法求解最优公式.在此基础之上,给出所求解策略的最优性边界,并从理论上证明了迁移到新MDP分布中策略的最优性主要依赖于MDP分布之间的距离以及所求解策略在原始MDP分布中的性能.最后,将FSPS算法用于经典的Markov Chain问题,实验结果表明,所求解的策略具有较好的性能.
- 朱斐刘全傅启明陈冬火王辉伏玉琛
- 一种基于线性函数逼近的离策略Q(λ)算法被引量:26
- 2014年
- 将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关联因子,在迭代次数逐步增长的过程中,使得在策略与离策略相统一,确保算法的收敛性.同时在保证在策略与离策略的样本数据一致性的前提下,对算法的收敛性给予理论证明.将文中提出的算法用于Baird反例、Mountain-Car及Random Walk仿真平台,实验结果表明,该算法与传统的基于函数逼近的离策略算法相比,具有较好的收敛性;与传统的基于查询表的算法相比,具有更快的收敛速度,且对于状态空间的增长具有较强的鲁棒性.
- 傅启明刘全王辉肖飞于俊李娇
- 关键词:函数逼近
- 基于高斯过程的路径规划研究
- 2014年
- 路径规划[1,2,3,4]是指按照某一性能标准搜索一条从起始状态到目标状态的最优或次优无碰路径。高斯过程指的是一组随机变量的集合,这个集合里面的任意有限个随机变量都服从联合高斯分布,它是一种普遍存在和重要的随机过程。由于其具有很强的普适性,所以在较复杂的未知情况下,适合用高斯过程来进行研究或者使用高斯过程模型来进行预识别。本文通过搭建物理模型,并采用MATLAB和eclipse编程工具对其进行实现,从而对各种条件下运行程序绘制的地图,进行对比分析。
- 邹青青汪笑宇崔晓龙王辉
- 关键词:路径规划高斯过程
- 基于加速度识别的姿态交互研究被引量:8
- 2009年
- 手势识别作为人机交互的一种重要实现技术一直是模式识别领域的研究热点之一。提出一种基于加速度的手势识别方法。首先为每个手势动作建立隐马尔可夫模型,通过采集到的手势动作的加速度值对模型进行优化,再利用优化的模型对加速度序列进行分类,根据加速度的不同对手势进行识别。该方法在手持移动设备上有良好的识别效果,对手持移动设备的交互研究具有重要意义。
- 孔俊其王辉张广泉
- 关键词:隐马尔可夫模型
- 一种二阶TD Error快速Q(λ)算法被引量:5
- 2013年
- Q(λ)学习算法是一种结合值迭代与随机逼近的思想的基于模型无关的多步离策略强化学习算法.针对经典的Q(λ)学习算法执行效率低、收敛速度慢的问题,从TD Error的角度出发,给出n阶TD Error的概念,并将n阶TD Error用于经典的Q(λ)学习算法,提出一种二阶TD Error快速Q(λ)学习算法——SOE-FQ(λ)算法.该算法利用二阶TD Error修正Q值函数,并通过资格迹将TD Error传播至整个状态动作空间,加快算法的收敛速度.在此基础之上,分析算法的收敛性及收敛效率,在仅考虑一步更新的情况下,算法所要执行的迭代次数T主要指数依赖于1/1-γ、1/ε.将SOE-FQ(λ)算法用于Random Walk和Mountain Car问题,实验结果表明,算法具有较快的收敛速度和较好的收敛精度.
- 傅启明刘全孙洪坤高龙李瑾王辉
- 关键词:ERROR
- 基于神经网络的强化学习研究概述被引量:4
- 2012年
- 随着强化学习的日益发展,研究越来越深入,将神经网络引入强化学习的研究中已经成为热点课题之一。本文首先介绍强化学习的定义、原理及一般结构,接着简单表述神经网络的基本内容和马尔科夫决策过程模型;然后将强化学习和神经网络融合,重点介绍了两种常见的学习算法,算法都是改进过并且融合了神经网络的特性;最后,简单介绍该方式的强化学习在人工智能,控制系统,游戏以及优化调度等领域的应用情况。
- 尤树华周谊成王辉
- 关键词:神经网络
- 基于三维加速度的连续手势识别被引量:5
- 2012年
- 由于基于图像处理的手势识别方法对环境背景要求较高且存在不稳定性问题,文章使用三维加速度传感器的连续数据进行手势识别。三维加速度传感器内置于大部分智能手机中,具有应用方便的特点。实验通过传感器获取加速度信号,经过低通滤波、去重力和特征提取的信号预处理过程后,结合隐马尔可夫模型和混合高斯模型的理论方法,实现手机手势的连续识别,并驱动应用层预先定义的交互命令。
- 周谊成尤树华王辉
- 关键词:手势识别三维加速度传感器智能手机隐马尔可夫模型混合高斯模型
- 人体行为理解进展研究
- 人体行为理解是将人体的姿势或动态行为与预先训练好的动作模板进行模式识别和匹配,并用自然语言等描述出来.本文对人体行为理解的研究历史和发展情况做了概述,总结了3种常用的技术方法:基于模板匹配、基于状态空间和基于语义描述的方...
- 卢晨王辉张广泉
- 关键词:语义描述模式识别
- 文献传递