ITSC 2025 Paper Abstract

Paper TH-LM-T27.2

Zhang, Yuanyuan (Hong Kong Polytechnic University), wang, yingying (University), SONG, BAOSHAN (The Hong Kong Polytechnic University), Wen, Weisong (Hong Kong Polytechnic University)

Integrity-Monitored Deep Reinforcement Learning for Safe and Robust Autonomous Navigation

Scheduled for presentation during the Regular Session "S27a-Safety and Risk Assessment for Autonomous Driving Systems" (TH-LM-T27), Thursday, November 20, 2025, 10:50−11:10, Broadbeach 3

2025 IEEE 28th International Conference on Intelligent Transportation Systems (ITSC), November 18-21, 2025, Gold Coast, Australia

This information is tentative and subject to change. Compiled on October 18, 2025

Keywords Autonomous Vehicle Safety and Performance Testing, Safety Verification and Validation Methods for Autonomous Vehicle Technologies

Abstract

Ensuring safe and robust autonomous navigation under uncertainty remains a fundamental challenge for deploying deep reinforcement learning (DRL) in real-world applications. This paper presents an integrity monitoring deep reinforcement learning (IM-DRL) framework that incorporates integrity monitoring (IM) principles inspired by global navigation satellite systems (GNSS). A novel integrity cost model (ICM) is introduced to quantify observation trustworthiness through probabilistic metrics, enabling adaptive safety constraints under sensor degradation and transient faults. IM-DRL combines these integrity metrics with model-based uncertainty estimation, allowing the agent to dynamically adjust safety thresholds in response to varying observation quality. To further enhance robustness, the framework injects systematically biased Gaussian noise into observations, simulating realistic sensor degradation and generating risk-critical scenarios without adversarial training. The resulting policy optimization remains computationally efficient while ensuring verifiable safety. Experimental results show that IM-DRL reduces the collision rate by up to 60.6% compared to baseline methods, and exhibits strong generalization and adaptability in environments with severe observation disturbances, demonstrating its promise for safe and robust autonomous navigation.