2026年6月22日,上海管理论坛第576期学术讲座《融合仿真、优化与强化学习求解供应链序贯决策问题》在上海大学管理学院420举行。主讲人为美国密苏里大学圣路易斯分校(University of Missouri – St. Louis)李海涛教授,讲座由上海大学管理学院李洪波副教授主持,吸引了众多师生积极参与。
李海涛教授现任美国密苏里大学圣路易斯分校(University of Missouri – St Louis, UMSL)供应链与数据分析系主任,先进供应链分析实验室创始主任。主要研究方向为优化建模、算法设计及其在供应链领域的应用,研究范畴包含供应链网络设计、供应链架构规划、资源配置、项目调度、车辆路径优化等。李海涛教授的主要研究成果发表于Transportation Science、European Journal of Operational Research、Decision Sciences、INFORMS Journal on Applied Analytics等知名期刊。李海涛教授目前担任Journal of the Operational Research Society、Transportation Journal、International Journal of Project Management等期刊编委。李海涛教授于2015 年荣获密苏里大学圣路易斯分校Douglas Durand杰出科研奖;拥有两项美国专利、多项技术发明备案,先后获评 2015 年度 UMSL 年度发明家、2025 年度校级资深研究员。

讲座中,李教授围绕《融合仿真、优化与强化学习求解供应链序贯决策问题》进行了深入浅出的分享。李教授首先系统分析了相关建模与算法设计方法,从战略、战术、运营三层级梳理供应链决策架构,并从动态/静态、确定与随机、集中与分散等维度对供应链优化问题分类,构建了清晰的研究框架。随后,李教授聚焦不确定场景下的动态序贯决策问题,介绍了马尔可夫决策过程(MDP)模型的核心构成,并提出了融合仿真、优化与强化学习的近似动态规划(ADP)算法框架。最后,李教授分享了该框架的两项实际应用成果。
讲座结束后,与会师生踊跃提问,围绕ADP与强化学习的区别与联系、MDP中状态变量的选取与设计、调度问题与博弈论的结合前景等问题与李教授进行了深入交流。李教授还结合自身的丰富经验,从选题兴趣、个人技能匹配、论文贡献定位和期刊选择等方面,为在场研究生的学术研究提供了宝贵的建议。本次讲座不仅为研究供应链优化的学者和管理研究者提供了一套清晰且可持续的学术框架,也为人工智能方法与传统运筹优化结合应用提供了深刻启发。
