基于 Reinforcement Learning 的接触网络随机疫苗分配策略

3月 17, 2025 · 1 分钟阅读时长

访问项目网站

将确定性最优控制与 Reinforcement Learning 相结合，开发了个体级接触网络上的随机疫苗分配策略，实现了鲁棒的疫情响应建模。

项目亮点

在接触图上使用高维连续时间马尔可夫过程 (CTMP) 对疫情传播进行建模。
设计了基于 Policy Gradient 的 RL 疫苗接种策略，并以 Mean-Field ODE 解作为热启动。
在合成和真实世界网络拓扑上评估了策略在死亡率和住院率等指标上的表现。

工具

Python, PyTorch, NetworkX, OpenAI Gym

最近更新于 4月 5, 2026

Reinforcement Learning Epidemic Modeling Networked Systems

占俊飞

Authors

博士研究生

← MPPI with Control Barrier Functions for F1/10：真实世界不确定性下的鲁棒安全控制 5月 7, 2025

基于混合 CNN 与 Logistic Regression 的音频材质分类 12月 15, 2024 →