New Page 1

不可撤回方式

不可撤回方式的控制策略是：选择一条可应用的操作作用于当前状态，不论后果如何都接着做下去。该方法类似于求函数极值的爬山法。

我们以八数码游戏为例。该游戏的初始状态和目标状态如图2-1所示。

图2-1 八数码游戏一例

我们选取“不再位”的数字个数的负值作为爬山函数。“不再位”的数字个数是指与目标状态描述相比有差异的数字个数。例如图2-1中初始状态的爬山函数位-4，目标状态的爬山函数为0。把游戏的操作可描述为下面的4条产生式规则：

（1）if空格不再最上一行 then空格上移

（2）if空格不再最下一行 then空格下移

（3）if空格不再最左一行 then空格左移

（4）if空格不再最右一行 then空格右移

从初始状态出发，我们应用第一条规则，即空格上移可获得爬山函数的最大增加，因此控制策略第一条规则作为当前的操作。图2-2表示了在求解八数码游戏时，使用这种策略所经过的状态系列。