首页  科学研究  发明专利
 
基于状态特征和后继特征的特征与策略的联合学习方法
文章来源:PSSS  作者:PSSS  发布时间:2022-04-25

申请号:CN201810601576.1

专利名称基于状态特征和后继特征的特征与策略的联合学习方法

发明人查正军; 李厚强; 冯晓云; 李斌; 王子磊

专利类型:发明专利

摘要

本发明公开了一种状态特征和后继特征的联合策略学习方法,包括:通过学习从输入状态到即时奖励的映射,获得表征输入状态的状态特征;通过学习从状态特征到价值评估函数的映射,获得后继特征;获得的状态特征与后继特征处于不同的时间分辨率上,将状态特征与后继特征融合后,再采用多种多样方式的策略学习网络对融合结果进行学习。与传统的Agent网络相比,本发明更高效的利用了样本信息,与其他算法相比,学习速度明显加快,网络也能更快的收敛且获得较好的学习效果。


 
 
相关链接
联系我们
安徽省合肥市金寨路96号
中国科学技术大学
火灾安全全国重点实验室
邮政编码:230026
   
Tel:(+86)551 63601651
Fax:(+86)551 63601669
E-mail:sklfs@ustc.edu.cn
Copyright © 1990-2011 State Key Laboratory of Fire Science, University of Science and Technology of China
火灾科学国家重点实验室 版权所有 皖ICP备:002106505 号