硕士毕业论文。一个面向异质接触网络的可扩展逐人疫苗分配框架,在随机 SEPAILHRVD 模拟器上对比「群体级最优控制 + 度数启发式」与端到端强化学习。
4月 23, 2026
开发了一种混合控制框架,将强化学习和滑模观测器集成到 MPC 中,实现扰动感知的 UAV 轨迹跟踪。
5月 7, 2025
将确定性最优控制与 Reinforcement Learning 相结合,开发了个体级接触网络上的随机疫苗分配策略,实现了鲁棒的疫情响应建模。
3月 17, 2025