不可撤回方式
不可撤回方式的控制策略是:选择一条可应用的操作作用于当前状态,不论后果如何都接着做下去。该方法类似于求函数极值的爬山法。
我们以八数码游戏为例。该游戏的初始状态和目标状态如图2-1所示。
图2-1 八数码游戏一例
我们选取“不再位”的数字个数的负值作为爬山函数。“不再位”的数字个数是指与目标状态描述相比有差异的数字个数。例如图2-1中初始状态的爬山函数位-4,目标状态的爬山函数为0。把游戏的操作可描述为下面的4条产生式规则:
(1)if空格不再最上一行 then空格上移
(2)if空格不再最下一行 then空格下移
(3)if空格不再最左一行 then空格左移
(4)if空格不再最右一行 then空格右移
从初始状态出发,我们应用第一条规则,即空格上移可获得爬山函数的最大增加,因此控制策略第一条规则作为当前的操作。图2-2表示了在求解八数码游戏时,使用这种策略所经过的状态系列。