%0 Journal Article %A 付文秀 %A 李亚 %A 吕继东 %A 李丹勇 %A 李洋 %T 基于强化学习的新型列控系统区间行车间隔控制方法 %D 2021 %R 10.11860/j.issn.1673-0291.20200110 %J 星空电竞app2026最新版学报 %P 63- %V 45 %N 5 %X 列车间隔控制是保证列车运行安全和提高列车行车密度的关键.基于车-车通信的新型列控系统能够感知更多的列车运行环境信息,缩小列车行车间隔,提升列车运行效率.本文将列车速度控制视为一个决策过程,采用强化学习算法来实现新型列控系统中列车区间速度的实时控制.首先,结合车-车通信获得所处环境的列车状态信息,采用蒙特卡洛树搜索算法实时生成列车动态速度调整序列;然后,通过动态规划算法对序列进行分析处理,并在此基础上,确定列车当前时刻所应采取的速度控制策略;最后,仿真模拟了多车在不同初始条件下的列车间隔控制运行场景.仿真结果表明,在相同场景下强化学习算法对比模糊控制算法在行车间隔控制的响应速度、调节时间、总体波动以及超调量上具有一定的优势. %U https://jdxb.bjtu.edu.cn/CN/10.11860/j.issn.1673-0291.20200110