秦进
- 作品数:56 被引量:237H指数:6
- 供职机构:贵州大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金贵州省科学技术基金贵州省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学电子电信更多>>
- 一种基于确定性环境模型的离线强化学习方法
- 2025年
- 现有的基于模型的离线强化学习方法中,大多着力于研究不同形式的保守主义应用,而忽略了对该类方法至关重要的部分——环境模型的研究。为了补充对环境模型影响的研究,提出了一种基于确定性模型的离线强化学习算法(deterministic model-based offline reinforcement learning,DMO)。首先,DMO针对离线数据与在线模型算法中数据特性的不一致,提出了一种适合离线RL问题的确定性建模环境的方法。其次,DMO使用转移中状态动作对在分布内的程度来衡量整个转移的不确定性,进而提出了基于不确定性衡量的奖励调整和模拟轨迹截断控制方法。DMO在D4RL的十二个机器人控制任务中进行了评估。最终在所有的测试任务中,DMO在以TD3+BC、BEAR、COMBO等算法为基线的比较中实现了8.2%~38%的平均得分提升。
- 汤瑞航黄初华秦进
- 结合新颖性和风险评估的内在奖励方法被引量:1
- 2023年
- 强化学习算法依赖于精心设计的外在奖励,然而Agent在和环境交互过程中,环境反馈给Agent的外在奖励往往是非常稀少的或延迟,这导致了Agent无法学习到一个好的策略。为了解决该问题,从新颖性和风险评估这两方面设计一个内在奖励,使Agent能充分地探索环境以及考虑环境中存在不确定性动作。该方法分为两部分,首先是新颖性描述为对当前状态-动作和转换后状态的访问次数,将具体执行的动作考虑进去;其次是动作的风险程度,风险评估从累积奖励方差考虑,来判断当前动作对状态的意义是有风险的还是无风险的。该方法在Mujoco环境下进行了评估,实验验证该方法取得了更高的平均奖励值,尤其是在外在奖励延迟的情况下,也能取得不错的平均奖励值。说明该方法能有效地解决外在奖励稀疏的问题。
- 赵英秦进袁琳琳
- 关键词:风险评估
- 一种智能物联网网关
- 本实用新型公开了一种智能物联网网关,包括网关主体,所述网关主体的一侧侧壁顶部位置嵌入设置有显示屏、电源开关和急停开关,所述急停开关设置在电源开关的下方,所述显示屏设置装置急停开关的一侧,所述网关主体的侧壁靠近显示屏的一侧...
- 何勇秦进
- 文献传递
- RBAC模型在信息化平台建设的权限管理中的研究与应用被引量:1
- 2015年
- 阐述了基于角色的权限管理模型(RBAC~[1])在高等教育信息化平台中的运用,提出了RBAC的权限管理的解决方案。将RBAC模型应用到系统中增强了系统的安全性。系统采用三层架构~[2],基于Java平台实现,项目中使用了S2SH~[3]框架,RBAC模型的实现是基于Struts2的原有代码的重写,保证了技术上的可靠性,有效地解决了信息化平台中的遇到的权限和安全问题。
- 任伟秦进
- 关键词:JAVAS2SH访问控制
- 一种求解动态优化问题的改进自适应差分进化算法被引量:2
- 2021年
- 针对原始动态自适应差分进化(SADE)算法局部搜索能力弱和寻优精度低的问题,提出一种求解动态优化问题的邻域搜索差分进化(NSDE)算法。通过引入邻域搜索机制,在划分种群最优个体的邻域空间范围内产生候选解,选取候选解集合中的最优解并对种群最优个体进行迭代,增强算法局部搜索能力。在传统基于距离的排斥方案中,引入hill-valley函数追踪邻近峰,提高算法寻优精度。实验结果表明,与SADE、人工免疫网络动态优化、多种群竞争差分进化和改进差分进化算法相比,NSDE算法在49个测试问题中分别有28、38、29和38个测试问题的平均误差更小,综合性能表现更好。
- 刘树强秦进
- 关键词:动态优化问题邻域搜索
- 基于图辅助学习的会话推荐
- 2024年
- 针对现有的自监督对比任务未能充分利用原始数据中的丰富语义以及缺乏通用性的问题,提出一种基于图辅助学习的会话推荐(SR-GAL)模型。首先,在图神经网络(GNN)的基础上引入具有表示一致性(RC)的编码通道,从原始数据中挖掘更有价值的自监督信号;其次,为了充分利用这些自监督信号,设计了与目标任务关系紧密的预测性辅助任务和约束性辅助任务;最后,开发了一个简单且与GNN模型无关的辅助学习框架,将两个辅助任务与推荐任务统一起来,从而提高GNN模型的推荐性能。与次优的对比模型CGSNet(Contrastive Graph Self-attention Network)相比,在Diginetica数据集上,所提模型的精确率P@20和平均倒数排名MRR@20提升了0.58%和1.61%;在Tmall数据集上,所提的模型的P@20和MRR@20分别提升了12.65%和8.41%,验证了该模型的有效性。在多个真实数据集上的实验结果表明,SR-GAL模型优于较先进的模型,并且具有良好的可扩展性和通用性。
- 唐廷杰黄佳进秦进
- 关键词:推荐系统
- 中文文本校对技术的研究与实现被引量:9
- 2003年
- 文本自动校对工作的计算机化是说所有的校对工作应在计算机上自动完成;具体地说是计算机应在文字处理上增加专为校对服务的功能,主要是查(侦)错和改(纠)错.
- 陈笑蓉秦进汪维家陆汝占
- 关键词:中文文本
- 基于动态迁移的光传送网SDN低时延调度研究被引量:2
- 2021年
- 光传送网SDN调度较传统网络具有更好的动态性,为了使SDN网络性能与大数据和云计算需求匹配,提出了一种低时延动态迁移策略。先以SDN网络结构、流表耗时、以及时延调整系数等变量构建通信代价模型,得到通信代价的目标与约束。基于通信代价模型对SDN网络架构采取动态迁移,根据路径请求量计算控制器的平均时延与累计效用,再利用控制与数据信道负载对流表采取动态调整。通过仿真,确定了光传送网SDN调度过程中,当控制器个数改变时,时延几乎不受影响;当数据量增加时,时延及其增速也能得到有效控制;在动态迁移后,负载差异度降低至迁移前的71.92%。实验结果表明所提方法能够有效降低光传送网SDN调度时延,并保证良好的网络负载均衡。
- 刘春林李韦鹏秦进
- 关键词:通信代价信道负载
- 基于最大熵原理的汉语词义消歧被引量:9
- 2005年
- 词义消歧是自然语言处理中亟待解决的一个关键问题,本文提出一种基于最大熵模型的有监督的机器学习方法,用于汉语词义消歧。该方法综合了词标记、词性、主题等上下文特征,并用一种统一的表示方法规范化特征形式,解决了多种不同特征之间的融合和特征的知识表示。实验对20个汉语高频多义词进行了测试,平均正确率为87%,验证了该方法的有效性。
- 陈笑蓉秦进
- 关键词:词义消歧最大熵原理机器学习方法最大熵模型多义词
- 特征和语言模型结合的中文文本查错
- 该文引入上下文词、搭配两种特征作为约束,利用最大熵原理构建查错模型,以期解决词语搭配不当、长距离的语言限制等词一级的错误.基本思想是,构建词语y在上下文x上出现的条件概率分布模型p(y|x),查错时根据句子中的上下文x计...
- 秦进
- 关键词:查错语言模型搭配最大熵
- 文献传递