
穿越沙漠游戏的策略研究
摘要
本文对穿越沙漠游戏中,玩家在不同情况下剩余总资金最多的决策规划问
题。本文运用动态规划、数学期望以及博弈论的相关知识,应用启发式方法,通
过 Python 程序求解,最后给出 6 关游戏中的最佳策略。
针对问题一,首先对村庄、矿山等关键区域进行分析,利用启发式方法确定
不同策略下的最优路径。其次根据物资消耗、天气情况、挖矿收益等因素分析,
建立对玩家剩余资金总量的动态优化模型。最后采用反向推导的方法,优先确定
关键区域的物资分配情况,进而求解出最佳策略。最终求解得到“第 1 关”的剩
余资金总量为 10450 元,“第 2 关”的剩余资金总量为 12350 元,并得到了” 第
1 关”和“第 2 关”的具体优化策略。
针对问题二,由于玩家缺少每天确定的天气情况,所以引入天气概率和数学
期望来表征一般情况下玩家的策略。根据概率分别求解出各参数期望值与高温
天气期望概率 P 的关系,进而可以对玩家的收益情况与高温天气概率进行量化
分析。我们使用 0-1 编码表示玩家的决策,转换为 2 进制数进行求解。同时,对
“第 4 关”中沙暴天气的概率进行简化分析。最终通过 Python 进行代码分析,我
们得到了“第 4 关”路途收益随高温天气概率变化图 (见图 6) 和“第 3 关”沙暴
天气出现 1 次和 2 次的最佳决策表 (见表 7、表 8)。
针对问题三,要求从 n(n>1) 名玩家的角度去寻找使得各个玩家玩家之间收
益最优的策略,故引入博弈论(又称对策论)分别对第 5 关和第 6 关的情况进行
博弈求解。对于第 5 关,在第 3 关的基础上可以得到 4 条最优路径 (见图 7),接着
采用两人非合作对策对两名玩家进行博弈,由于天气已知,故易于得到一个玩家
A 关于“不吃亏”的零和矩阵,得到在纳什均衡的情况下都选择路线 1;然后采用
合作对策,在两人合作联盟的情况下,最终得到玩家 A,B 选择路线的两个最优
路径:{路线 1,路线 4}、{路线 4,路线 1}(见表 10)。对于第 6 关,我们在满足题目
信息的情况下,对 5 种特定情况进行讨论,最后根据讨论的结果,给出了一个一
般情况下一般玩家会选择的路径:1(起点)-6-11-16-17-18-13-14-13-18-23-24-25
(终点)。
最后,本文对模型的优缺点进行评价,同时给出对模型改进与推广的方法。
关键字: 动态规划 启发式方法 数学期望 博弈论
1