唐昊
- 作品数:226 被引量:248H指数:8
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电气工程理学电子电信更多>>
- 基于对等SAP的Q学习在机器人作业分配中的应用
- 基于强化学习,文章讨论了高速搬运系统中多个机器人的作业分配问题。针对状态空间随机器人个数增加呈指数增大这一难题,提出对等状态-行动对(State-Action Pair)概念,设计了一种改进的Q学习算法。在该算法中,每次...
- 丁丽洁唐昊周雷
- 关键词:Q学习
- 文献传递
- 多链MDP的鲁棒控制策略求解
- 2008年
- 马尔可夫决策过程(MDP)的许多优化算法一般依赖系统的转移速率,而系统参数的不确定性使得MDP的转移速率往往很难精确得知。针对一类不确定多链MDP模型,基于性能势对参数不相关和相关两种情况下的鲁棒控制问题进行了探讨,并分别给出求解系统最优鲁棒性能的策略迭代和并行遗传算法。最后,通过一个数值例子分析相关算法的有效性。
- 周雷唐昊程燕
- 关键词:性能势鲁棒控制并行遗传算法
- 一种用于传送带给料加工站系统的多目标优化控制方法
- 本发明公开了一种用于传送带给料加工站系统的多目标优化控制方法,包括:1、令k=1,初始化<Image file="DDA0001476588330000011.GIF" he="79" imgContent="drawi...
- 谭琦胡知强唐昊肖奕霖戴飞周雷杨子豪
- 弹性资源介入下基于知识矩阵跨维度迁移的电力调度优化
- 2025年
- 各类源荷弹性资源逐渐介入电网,使得电力系统的动态特性进一步复杂化。为提升电力系统调度优化任务的学习效率,基于弹性资源介入前源电力系统的调度知识矩阵提出一种跨维度迁移的学习优化方法。首先,利用欧式-动态时间弯曲距离,给出源任务与目标任务间关联特征的相似度判定方法。然后,引入主成分分析特征降维技术,建立源任务与目标任务间相似状态/动作的映射关系,提出基于调度知识矩阵跨维度迁移的强化学习方法,解决因源任务与目标任务状态或动作维数不同而导致的历史调度知识不能直接利用的问题。最后,以IEEE-300节点系统进行仿真分析,结果表明,所提方法能有效利用源任务的历史调度知识,实现弹性资源介入时复杂电力系统的快速调度优化。
- 唐昊杨晨芳程文娟王正风史明光
- 关键词:电力调度
- 一种改进的TP+LCM全贴合系统及控制方法
- 本发明公开了一种改进的TP+LCM全贴合系统及控制方法,其特征在于包括:传送带、若干个加工站点,传送带上随机分布有尺寸相同的TLCM(贴合后产品),每个站点包括加工中心、缓存库、导轨、抓手、前视传感器和投料点;系统以传送...
- 唐昊张彪王彬
- 文献传递
- 服务率可变的单站点CSPS系统优化控制
- 研究一类服务率可变的单站点传送带给料生产加工站(Conveyor-Serviced Producvion Stavion,简称为CSPS)的优化控制问题。在实际生产中,服务率可变反映了生产中劳动强度的变化,也是调整系统生...
- 庆琪琛唐昊周雷江琦
- 关键词:半MARKOV决策过程
- 文献传递
- 基于分层强化学习的电动汽车充电场站协同调峰方法
- 本发明涉及电力系统技术领域,尤其涉及一种基于分层强化学习的电动汽车充电场站协同调峰方法,该方法包括以下步骤:S1、定义充电桩的状态、充电等待车位的状态、等待车位的联合状态,根据服务电价制定单元及充电功率控制单元制定系统运...
- 唐昊方道宏李端超王正风王吉文王海伟
- 基于IDE-FLANN方法的六维力传感器动态建模研究
- 2020年
- 针对六维力传感器动态建模问题,提出了一种改进差分进化算法结合函数连接型神经网络(IDE-FLANN)的动态建模方法,该方法在继承了函数连接型神经网络(FLANN)特殊结构的基础上,进一步发展了差分进化算法(DE)的寻优建模能力,具有结构巧妙、建模能力强的特点。实验结果表明:该方法可以有效克服FLANN方法易于陷入局部最优值的缺陷,与常用建模方法相比,该方法具有建模速度快、精度高、鲁棒性强的优点。
- 汪正全唐昊孙玉香高理富曹会彬
- 关键词:六维力传感器动态建模差分进化
- 一种基于改进WGAIN的风电功率缺失数据补全方法
- 本发明属于风电功率缺失数据补全领域。为解决风电功率数据缺失问题,本发明提出了一种基于改进生成对抗插补网络的数据补全方法。该方法在生成器中融合了卷积神经网络、长短时记忆网络和自注意力机制,以充分挖掘时间序列数据的长期依赖性...
- 唐昊黄健王涛程文娟张芳海陈曦
- 一种考虑前视距离的相容工件族的优化控制方法
- 本发明公开了一种考虑前视距离的相容工件族的优化控制方法,包括:1通过强化学习算法得到最优Q值表;2在第k+g个决策时刻,根据观察到的系统的联合状态,查找最优Q值表,得到相应的前视距离和选择加工工件族动作;3判断该决策时刻...
- 谭琦肖奕霖胡知强唐昊