基于DQN的车辆驾驶行为决策方法

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于DQN的车辆驾驶行为决策方法

罗鹏, 黄珍, 秦易晋, 陈志军

文章导航 > 交通信息与安全 > 2020 > 38(5): 67-77,112

罗鹏, 黄珍, 秦易晋, 陈志军. 基于DQN的车辆驾驶行为决策方法[J]. 交通信息与安全, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

引用本文:

罗鹏, 黄珍, 秦易晋, 陈志军. 基于DQN的车辆驾驶行为决策方法[J]. 交通信息与安全, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

LUO Peng, HUANG Zhen, QING Yijin, CHEN Zhijun. A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm[J]. Journal of Transport Information and Safety, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

Citation:

LUO Peng, HUANG Zhen, QING Yijin, CHEN Zhijun. A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm[J]. Journal of Transport Information and Safety, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

罗鹏, 黄珍, 秦易晋, 陈志军. 基于DQN的车辆驾驶行为决策方法[J]. 交通信息与安全, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

引用本文:

罗鹏, 黄珍, 秦易晋, 陈志军. 基于DQN的车辆驾驶行为决策方法[J]. 交通信息与安全, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

LUO Peng, HUANG Zhen, QING Yijin, CHEN Zhijun. A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm[J]. Journal of Transport Information and Safety, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

Citation:

LUO Peng, HUANG Zhen, QING Yijin, CHEN Zhijun. A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm[J]. Journal of Transport Information and Safety, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

基于DQN的车辆驾驶行为决策方法

doi: 10.3963/j.jssn.1674-4861.2020.05.008

武汉理工大学自动化学院武汉 430070
武汉理工大学自动化学院武汉 430070
武汉理工大学自动化学院武汉 430070
武汉理工大学智能交通系统研究中心武汉 430063

基金项目:

国家重点研发计划项目

湖北省创新群体项目

中图分类号: U471.1
计量
- 文章访问数: 650
- HTML全文浏览量: 89
- PDF下载量: 14
- 被引次数: 0
出版历程
- 刊出日期: 2020-10-28

A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm

摘要: 针对传统DQN算法下网联车驾驶行为决策的动作选择过程随机性强、探索空间大的问题,研究了结合专家知识和DQN算法的智能车辆决策框架,设计了奖励值函数来引导算法的训练.通过层次分析法(AHP)选取高速场景下车辆驾驶决策中的重要影响因素,利用ID3决策树构建简单而有效的专家规则库;在传统算法基础上,通过设计奖励值函数来优化DQN网络结构,由奖励值函数引导DQN算法来解决高速场景下的车辆决策问题,并在Python仿真环境中构建高速交通场景对该算法进行分析和验证.实验结果表明,在高速直道和并道场景下,达到95%成功率的平均训练次数分别减少了100次和200次,平均奖励值分别提高了4.02和1.34,有效加快了DQN算法的动作选择,降低了探索过程中的动作随机性.
- 智能驾驶 /
- 强化学习 /
- DQN算法 /
- 专家知识

参考文献(0)

资源附件(0)

WeChat

点击查看大图

计量

文章访问数: 650
HTML全文浏览量: 89
PDF下载量: 14
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有《交通信息与安全》编辑部鄂ICP备05003336号-2

通信地址：湖北省武汉市武昌区和平大道1178号，武汉理工大学余家头校区 (430063)

联系电话：027-86580355电子邮箱：jtjsj@vip.163.com

本系统由北京仁和汇智信息技术有限公司开发