随机学习与优化在现代工程、社会、金融问题中具有广泛的应用。《随机学习与优化:基于灵敏度的方法》以一个统一的框架,涵盖了离散事件动态系统的摄动分析、马尔可大决策过程、强化学习、辨识和自适应控制等学习和优化的不同学科;并利用基于性能差分公式的简单方法介绍马尔可夫决策过程理论,通过该方法能求得以长期平均代价为准则的n阶偏差优化策略以及无折扣的Blackwell优化策略。《随机学习与优化:基于灵敏度的方法》还包含有最近发展出来的基于事件的优化方法,它为利用系统的特性来克服或减轻维数灾的研究开辟了个新方向。《随机学习与优化:基于灵敏度的方法》强调以样本路径的构造为基础的物理解释,物理上的直观认识可以为完善已有的优化方法提供新思路。