第3章


搜索策略

本章学习目标

● 理解搜索的基本概念。
● 掌握盲目搜索算法:深度优先搜索和宽度优先搜索。
● 掌握启发式搜索算法:A搜索和A*搜索。
● 掌握局部搜索算法:爬山法、模拟退火法和遗传算法。
人们在求解许多问题时都采用试探的搜索方法,希望尽可能找到一个令人满意的解。
例如,童年时代玩华容道游戏以及八数码问题等智力游戏,就是一个不断尝试和探索的搜索
过程。当我们终于找到了一种解决办法,又会想:这个方案所用的步骤是否最少? 即是不
是最优方案。若不是,怎样才能找到最优方案? 如何用计算机代替人类完成这样的搜索? 
为模拟这些试探性的问题求解过程而发展的一种技术就称为搜索技术。

搜索技术是人工智能中的一个核心技术,它直接关系到智能系统的性能和运行效率。
以2.已知智能体的初始状态和目标

4节中介绍的状态空间表示法描述所求解的问题空间, 

状态,搜索问题就是求解一个操作序列,使得智能体能从初始状态转移到目标状态,搜索问

题的主要任务是找到正确的搜索策略。搜索策略是指在搜索过程中确定扩展状态顺序的规

则。所求得的从初始状态转移到目标状态的一个操作序列就是问题的一个解,若某操作序

列可以使总代价最低,则该方案称为最优解。

本章将首先介绍图搜索策略的概念,然后介绍盲目搜索的两种典型算法(深度优先搜
索、宽度优先搜索)和启发式搜索的两种典型算法(A搜索、A*搜索), 最后介绍局部搜索的
三种算法(爬山法、模拟退火法、遗传算法)。

3.图搜索策略
1 

很多搜索问题都可以转化为图搜索问题,即在图结构中搜索该问题的解决方案。为了
进行搜索,首先需要采用某种形式表示所要求解的问题,表示方法是否适当将直接影响搜索
效率。一般常用状态空间表示法描述所求解的问题空间。然后在状态空间中搜索,以求得
一个从初始状态到目标状态的操作算子序列,即问题的解。对于一个确定的问题,与求解有
关的状态空间往往只是整个状态空间的一部分,只要能生成并存储这部分状态空间,就可求


得问题的解。

在状态空间图中,求解一个问题就是从初始状态出发,不断运用可使用的操作,在满足
约束的条件下达到目标状态,故搜索技术又称为“状态图搜索”方法。通过图搜索求解问题
的基本过程如下。

(1)采用状态空间表示法描述所有状态的一般表示,并给出问题的初始状态和目标
状态。
(2)规定一组操作(算子), 每个操作(算子)都能够将一个状态转换到另一个状态。
(3)选择一种搜索策略,用于遍历或搜索该问题的状态图空间。
(4)将问题的初始状态(即初始节点)作为当前状态。
(5)按已确定的搜索策略选择适用的操作(算子), 对当前状态进行操作,生成一组后继
状态(或称为后继节点、子节点)。
(6)检查新生成的后继状态中是否包含目标状态。若包含,则搜索到了问题的解,从初
始状态到达目标状态的操作序列即为解,算法结束;若不包含,则按已确定的搜索策略,从已
生成的状态中选择一个状态作为当前状态,若已无可操作的状态,则未搜索到解,算法结束。
(7)返回至第(5)步。
例如,4节中介绍的八数码问题,八数码的所有摆法构成了状态集合S,已知初始状态
2.
和目标状态,搜索一个从初始状态到达目标状态的操作序列,即为八数码问题的一个解。
在实现图搜索的算法中,需建立两个数据结构:OPEN 表和CLOSED 表。OPEN 表用
于存放待扩展的节点,CLOSED 表用于存放已扩展的节点。所谓扩展节点,是指用合适的
操作(算子)对该节点进行操作,生成一组后继节点。一个节点经过一个算子操作后,一般只
生成一个后继节点,但对于一个节点,适用的算子可能有多个,故此时会生成一组后继节点。
需要注意的是:在这些后继节点中,可能包含当前节点的父节点、祖父节点,则这些祖先节
点不能作为当前节点的子节点。图搜索不允许重复访问节点,即OPEN 表和CLOSED 表
的交集为空。图搜索策略就是选择下一个被扩展节点的规则。

基于状态空间图的搜索算法的步骤如下。

(1)初始化,将OPEN 表和CLOSED 表置空。
(2)将初始节点
S 
放入OPEN 表中,并建立目前只包含
S 
的搜索图Graph。
(3)检查OPEN 表是否为空,若为空,则问题无解,算法结束;否则执行下一步。
(4)将OPEN 表的第一个节点(记为n)取出,放入CLODED 表中。
(5)若节点
n 
就是目标节点,则已求得问题的解,此解可从目标节点追溯到初始节点的
前驱指针链得到,算法结束;否则继续执行下一步。
(6)扩展节点n,若
n 
没有后继节点,则转到步骤(3); 否则生成
n 
的一组子节点,将其
中不是
n 
祖先的那些子节点记作集合
M 
={mi}, 并将所有mi 
作为节点
n 
的子节点加入图
Graph中。
(7)
M 
中的节点mi分为三类,需分别处理:第一类是既不包含于OPEN 表,也不包含
于CLOSED 表中的节点,记为{mj}, 设置其前驱指针指向节点n(即令节点
n 
成为mj 
的父
节点), 并将{mj}放入OPEN 表中;第二类是包含于OPEN 表中的节点,记为{mk 
}, 检查是
否需要修改它指向父节点的前驱指针;第三类是包含在CLOSED 表中的节点,记为{ml 
}, 
检查是否需要修改其后继节点指向父节点的前驱指针。


(8)按某种搜索策略对OPEN 表中的节点进行排序。
(9)返回至第(3)步。
通常有两种方式的搜索策略:一种是在不具备任何与给定问题有关的知识或信息的情
况下,系统按照某种固定的规则依次或随机地调用操作算子,这种搜索方法称为盲目搜索策
略(blindsearchstrategy), 又称为无信息引导的搜索策略(uninformedsearchstrategy); 另
一种是可应用与给定问题有关的领域知识,动态地优先选择当前最合适的操作算子,这种搜
索方法称为启发式搜索策略(huitcsactaegy) ifrme

searchstrategy )。
ersierhsrt或有信息引导的搜索策略(nod 

不同搜索策略的搜索性能也不同。搜索策略性能的评价标准包括完备性和最优性。当
问题有解时,若搜索算法保证能找到一个解,则称该搜索算法具有完备性,否则称之为不完
备。当问题有最优解时,若搜索算法保证能找到一个最优解(即最小代价路径), 则称该搜索
算法具有最优性,否则称之为不具有最优性。

3.盲目的图搜索策略
2 

在盲目搜索的过程中,没有任何与问题有关的先验知识或者启发信息可以利用,算法只
能判断当前状态是否为目标状态,而无法比较两个非目标状态的好坏。

深度优先搜索和宽度优先搜索是常用的两种盲目搜索算法,它们是采用同一种搜索策
略的不同搜索算法,节点在OPEN 表中的排列顺序是不同的,所以不同搜索算法的区别仅
在于扩展节点的顺序不同。

3.1 
深度优先搜索
2.
深度优先搜索(depth-firstsearch,DFS)的基本思想是:优先扩展深度最深的节点。在
一个图中,初始节点的深度定义为0,其他节点的深度定义为其父节点的深度加1。

深度优先搜索总是选择深度最深的节点进行扩展,若有多个相同深度的节点,则按照指
定的规则从中选择一个;若该节点没有子节点,则选择一个除了该节点之外的深度最深的节
点进行扩展。依此类推,直到找到问题的解为止;或者直到找不到可扩展的节点,结束搜索, 
此种情况说明没有找到问题的解。

在编程实现深度优先搜索算法时,采用栈(即先进后出的线性表)作为OPEN 表的数据
结构。深度优先搜索算法将OPEN 表中的节点按其深度的降序排序,深度最大的节点总是
排在栈顶,深度相同的节点可按某种事先约定的规则排列。

深度优先搜索算法的过程如下。

(1)将初始节点
S 
放入OPEN 表的栈顶。
(2)若OPEN 表为空,表示再也没有可扩展的节点,即未能找到问题的解,则算法
结束
(
。
3)将OPEN 表的栈顶元素(记为节点n)取出,放入CLOSED 表中。

(4)若节点
n 
是目标节点,则已求得问题的解,算法结束。
(5)若节点
n 
不可扩展,即
n 
没有后继节点,则转至步骤(2)。
(6)扩展节点n,将其所有未被访问过的子节点依次放入OPEN 表的栈顶,并将这些子

节点的前驱指针设为指向父节点n,然后转至步骤(2)。

深度优先搜索一直选择深度最深的节点进行扩展,对于状态空间有限的问题,深度优先
搜索是完备的,因为它最多扩展所有节点,直到找到一个解。但在无限状态空间中,若沿着
一个“错误”的路径搜索下去而陷入“深渊”,则会导致无法到达目标节点,在这种情况下,深
度优先搜索是不完备的。为避免这样的情况,在深度优先搜索中往往会加上一个深度限制, 
称为深度受限的深度优先搜索,即在搜索过程中,若一个节点的深度达到了事先指定的深度
阈值k,无论该节点是否有子节点,都强制进行回溯,选择一个比它浅的节点进行扩展,而不
是沿着当前节点继续扩展。深度受限的深度优先搜索相当于假定深度为
k 
的节点没有后
继节点,其余的操作与深度优先搜索相同。如此一来,又可能因为深度限制过浅而找不到
解。例如,假设所求解问题的解在深度为6的层次,但将深度限制设为4,就会找不到解。
所以,应该根据具体问题合理地设定深度限制值,或在搜索过程中逐步加大深度限制值,反
复搜索,直到找到解。

下面以八数码问题为例,介绍深度受限的深度优先搜索的过程。

例3.假设有八数码问题的初始状态如图3.a) 要求采用深度优先搜索算法找

1 
1(所示, 
到图3.1(b)所示的目标状态。


图3.八数码问题的一个实例

1 

假设规定空白格的操作依次按向左、向上、向右、向下的顺时针顺序进行深度优先搜索, 
深度限制为4,则会形成图3.

2所示的八数码问题的部分状态空间。其中圆圈里的数字编号
表示访问节点的顺序,其间仅扩展了编号为1、2、3、4、7、8、11 、12 、13 的节点。因为深度限制
为4,在深度为4的层上的节点5、6、9、10 均不被扩展。当判断出其为非目标状态时,直接
回溯到上一层,当搜索到节点14 时,判断出其为目标状态,算法结束。

在深度优先搜索过程中,可能会遇到“死循环”情况,即在一个环路中重复搜索而跳不出
来。为避免这种情况,可以在搜索过程中记录从初始节点到当前节点的路径上每个被扩展
的节点;然后,每遇到一个节点,就先检测该节点是否已出现在这条路径上:若未出现,则扩
展它;若已出现过,则采用其他合理操作形成节点,若无合理操作,则强制回溯到该节点的上
一层。例如,在图3.按规定, 则出现与节点3相

2中节点4的状态时, 空白格应先向左移动, 
同的状态,这时DFS 算法检测出:节点3已出现在从节点1到节点4的路径上,就会换下一
个合理的操作:向右移动,形成子节点5。由于深度限制为4,虽然节点5不是目标状态,也
不再扩展它,而是强制回溯到上一层的节点4,探索节点4的下一个合理的空白格操作:向
下移动,形成子节点6。基于同样的原因,不再扩展节点6,回溯到节点4,此时已尝试完成
节点4所有合理的空白格操作,只能回溯到上一层节点3,以此类推。

除初始节点外,每个节点的前驱指针均被设置为指向其父节点,当找到目标节点后,依
次沿着路径上每个节点的前驱指针可反向追踪到初始节点,即得到问题的解。例如,在


图3.采用深度限制为4的深度优先搜索算法求解八数码问题的搜索图

2 

图3.从目标节点14 开始, 得到路径14→13→12→11→ 

2中, 依次追溯各个节点的前驱指针, 
1,将该路径反向输出,1中八数码问题的解为1→11→12→13→14 。

即可得到图3.
深度优先搜索不具有最优性,因为它无法避免冗余路径。如图3.从节点1出

2所示, 
发,扩展其左子树上的所有节点,都是冗余路径,事实上,从节点1出发,依次扩展其右子树
上的节点11 、12 、13,仅需4步即可找到目标节点14 。若不设置深度限制,则可能经过更多
的冗余路径,而且还可能陷入“深渊”,导致无法到达目标节点。

3.2 
宽度优先搜索
2.
宽度优先搜索也称为广度优先搜索(breadth-firstsearch,BFS), 其基本思想是:优先扩
展深度最浅的节点。先扩展根节点,再扩展根节点的所有后继,然后再扩展它们的后继,以
此类推。如果有多个节点深度是相同的,则按照事先约定的规则,从深度最浅的几个节点中
选择一个,进行扩展。

在编程实现宽度优先搜索算法时,采用队列(先进先出的线性表)作为OPEN 表的数据
结构。宽度优先搜索将OPEN 表中的节点按节点深度的增序排列,深度最浅的节点排在
OPEN 表的队头,新节点(深度比其父节点深)总是插入OPEN 表的队尾,深度相同的节点
可按某种事先约定的规则排列,这意味着浅层的老节点会在深层的新节点之前被扩展。宽
度优先搜索算法的过程如下。

(1)将初始节点
S 
放入OPEN 表的队头。
(2)若OPEN 表为空,表示再也没有可扩展的节点,即未能找到问题的解,则算法结束。

(3)将OPEN 表的队头元素(记为节点n)取出,放入CLOSED 表中。
(4)若节点
n 
是目标节点,则已求得问题的解,算法结束。
(5)若节点
n 
不可扩展,即
n 
没有后继节点,则转至步骤(2)。
(6)扩展节点n,将其所有未被访问过的子节点依次放入OPEN 表的队尾,并将这些子
节点的前驱指针设为指向父节点n,然后转至步骤(2)。
可见,宽度优先搜索与深度优先搜索的唯一区别是:宽度优先搜索是将节点
n 
的子节
点放入OPEN 表的尾部,而深度优先搜索是将节点
n 
的子节点放入OPEN 表的首部。仅
此一点不同,就使得搜索的路线完全不同。

例3.采用宽度优先搜索算法求解图3.

2 
1中的八数码问题。假设规定空白格的操作
依次按向上、向右、向左的顺时针顺序进行宽度优先搜索,3所示。圆

向下、则搜索图如图3.
圈里的数字编号表示访问节点的顺序,其间仅扩展了编号为1~15 的节点。


图3.采用宽度优先搜索算法求解八数码问题的搜索图

3 

宽度优先搜索是完备的。若路径代价是节点深度的非递减函数,或者每步代价都相等, 
那么宽度优先搜索还具有最优性。因为宽度优先搜索总是在扩展完第
k 
层的所有节点后
才去扩展第k+1 层的节点,所以,若问题有解,宽度优先搜索一定能找到最小代价的解,即
最优解。例如,在八数码问题中,如果移动每个数码牌的代价都相同,假设代价都计为1,则
采用宽度优先搜索算法找到的解一定就是移动数码牌次数最少的最优解。但由于宽度优先
搜索在搜索过程中需保存已访问的所有节点,则运行该算法需要占用较大的存储空间,而且
随着搜索深度的加深,存储空间呈几何级数增加。

与宽度优先搜索相比,深度优先搜索算法所需的存储空间要小得多,因为它只需存储从
初始节点到当前节点的一条路径即可,其所需存储空间与搜索深度呈线性关系。所以,深度


优先搜索的优点是节省大量的时间和空间。

在不要求求解速度且目标节点的层次较深的情况下,BFS 优于DFS,因为BFS 一定能
够求得问题的解,而DFS 在一个扩展得很深但又没有解的分支上进行搜索,是一种无效搜
索,降低了求解的效率,有时甚至还不一定能找到问题的解。在要求求解速度且目标节点的
层次较浅的情况下,DFS 优于BFS,因为DFS 可快速深入较浅的分支,找到解。

3.启发式图搜索策略
3 

3.2节介绍的两种搜索算法都属于盲目搜索策略,它们采用固定的搜索模式,不针对具
体问题。盲目搜索策略在选择要被扩展的节点时,没有利用所求解问题的任何先验信息,既
不对待扩展的状态的优劣进行判断,也不考虑所求的解是否为最优解。但很多时候,人类对
两个状态的优劣是要进行判断的。例如,在图3.以节点①为初始状态,
4中, 我们会优先选
择节点⑤进行扩展,因为在节点⑤上仅需移动一次空白格即可到达目标节点;若先扩展节点

②,目测看不出来是否能到达目标节点,即使能找到解,也一定不是最优解。可见,盲目搜索
策略会导致所需扩展的节点数很多,产生很多无用的节点,搜索效率较低。
启发式搜索是将人类解决问题的“知识”告诉机器,即启发式信息(heuristicinformation), 
使搜索算法能够利用启发式信息更“聪明”地搜索,尽可能地缩小搜索范围,减少试探的次
数,提高搜索效率,避免大海捞针。


图3.八数码问题中节点⑤比节点①的状态好

4 

启发式搜索策略的基本思想是在搜索过程中利用与所求解问题有关的特征信息,指导
搜索向最有希望到达目标节点的方向前进。启发式搜索的每一步都选择最优的操作,以最
快速度找到问题的解。一般只需要知道问题的部分状态空间就可求解该问题,搜索效率较
高。本节介绍两种常用的启发式搜索算法:A搜索和A*搜索。


3.1 A 
搜索
3.
为了尽快找到从初始节点到目标节点的一条代价比较小的路径,在搜索的每一步,我们
都希望选择在最佳路径(即代价最小的路径)上的节点进行扩展,但如何估算一个节点在最
佳路径上的可能性呢?A搜索采用评价函数来计算: 

f(g(n)

n)=n)+h(
其中,
n 
为待评价的节点,如图3.n)

h(n)
5所示,g(为从初始节点
S 
到节点
n 
的最佳路径上代价
的实际值,为从节点
n 
到目标节点
E 
的最
佳路径上代价的估计值,称为启发函数,n)

f(为
从初始节点
S 
出发、经过节点
n 
到达目标节点
E 
的最佳路径上代价的估计值,称为评价函数。这
里的路径代价,可以是路径长度、经历的时间或
花费的费用等。当h(n)=0时,说明已到达目
标节点。

A搜索是一种贪心算法,其核心思想是:每
5 
一步都选择距离目标最近的节点进行扩展。A 
图3.评价函数的组成
搜索的策略为:设计一个评价函数f(将所有待评价的节点按评价函数值f(的升序

n), n) 
排列,存放在OPEN表中(采用队列作为数据结构),然后选择评价函数f(n)值最低的节点
作为下一个将要被扩展的节点。由于最佳节点总是排在OPEN表的队首,因此A搜索又称
为最佳优先搜索(bestfirstsearch)。

在评价函数f(n)=g(n) 当f(g(即h(=0时,

n)+h(中, n)=n), n)A搜索就退
化为盲目搜索。当f(n)=节点
n 
在搜索树上的深度时,则A搜索成为宽度优先

n)=g(
搜索。当f(n)=h(n)0时, retfrtsac

n),即g(=称为贪婪最佳优先搜索(gedybs-iserh, 
GBFS),简称贪婪搜索。贪婪最佳优先搜索是最佳优先搜索的特例,它的评价函数仅使用
启发函数h(n)对节点进行评价,其搜索策略是:在每一步,它总是优先扩展与目标最接近
的节点。贪婪搜索策略不考虑整体最优,仅求取局部最优。贪婪搜索是不完备的,也不具有
最优性,但其搜索速度非常快。

例3.采用A搜索求解八数码问题。

3 

n), n) 
在搜索树中的深度;启发函数h(
n)= 

首先,需要设计评价函数f(其中g(一般定义为已移动数码牌的步数,即节点
n 

n)定义如下: 

h(
h(错位数码牌的个数
统计目前所在位置与目标位置

n)的含义是:将待评价的状态与目标状态进行比较, 
不同的数码牌的个数,称为错位数码牌的个数,该数值基本上可以反映当前节点与目标节点

的距离。
6中的初始状态与目标状态进行比较, 2、

将图3.发现1、8三个数码牌不在其应该在的
位置上,则错位数码牌的个数为3, n)=3, n) 则f(=3。

即h(初始状态的g(值为0, n)
然后,将空格块依次向左、向下、向右移动,按照上述方法计算各个状态的
h 
值和
f 
值。
用A搜索求解八数码问题的搜索图如图3.其中
g 
的值表示已移动数码牌的步数,

6所示, 
从初始状态往下,
g 
值依次为1~5,即表示该节点在搜索树上的深度。每个节点上面都标


图3.采用
A 
搜索解决八数码问题示例

6 

注了该状态的
g 
值和
h 
值,左边的“字母(数值)”表示“状态名称(
f 
值)”,圆圈中的数字表
示该节点被扩展的顺序,不带圆圈数字的状态表示该节点未被扩展。可见,在搜索的过程
中,只有状态S、A、B、C、D、I、O、P被依次扩展了,因为它们的
f 
值在当时情况下最小,而其
他节点的
f 
值不是最小,便没有被扩展的机会。直到找到目标节点Q,算法结束,该解的路

径代价为5。
6的搜索过程可知:计算f(其中g(

从图3.n)是实现A搜索的关键, n)是从初始节点
S 
到当前节点
n 
路径上的代价值,很容易通过已搜索过的路径计算得到。而启发函数h(
则需要根据所求解问题的定义设计。针对同一个待求解问题,可以定义不同的启发函数
n)
。
因此,选取一个好的启发函数h(则有可能找

n)是保证找到最优解的关键。如果选择不当, 
不到问题的解,即使能找到解,也不一定是最优解。这时,A搜索是不完备的,也不具有最
优性。

3.搜索
3.2 
A* 
在A搜索中,由于对启发函数未做出任何限制,所以不好评价A搜索求得的结果。我
们发现:当评价函数中只包含g(时, 若在评价函数中加入“一点”启发信

n) 属于盲目搜索; 
息h(n), 搜索效率就会提高; n)过大, n), 导致脱离实际情

但如果启发函数h(则会忽略g(
况,反而不能保证总能找到最优解了。因此,需要对启发函数加以限制,这就是本节要介绍


的A*搜索。
n)定义为从当前状态
n 
到目标状态的最佳路径上的实际代价,即最小代价。可以h*(
n)满足条件h((

证明:如果启发函数h(n)≤h*n), 则当问题有解时,A搜索一定能找到

一个代价值最小的解,即最优解。满足该条件的A搜索称为A*搜索。A*搜索是最佳优先

搜索的最广为人知的形式,也称为最佳图搜索算法。

一般来说,(那么如何判断h((这就要根据具

h*n)是未知的, n)≤h*n)是否成立呢? 
体问题分析了。例如,所求问题是在地图上找到一条从地点A到地点B的距离最短的路
径,可以采用当前节点到目标节点的欧氏距离作为启发函数h()。虽然不知道h*n)是

因此,(
n 
肯定有h(
(
(

什么,但由于两点之间直线距离最短, 无论怎样定义h*n), n)≤h*n)。
只要满足此限定条件,就可以用A*搜索找到该问题的一条最优路径。A*搜索与A搜索没
有本质区别,只是规定了启发函数的上限。A*搜索既是完备的,也是最优的。

()。假设h*(

下面证明例3.3中的启发函数满足限定条件h(n)≤h*nn)定义为:将
当前状态中所有错位的数码牌移动到其正确位置所需的最少的实际步数。令
w(节点
n 
所表示的状态中错位数码牌的个数
n) 
n)= 
至少需要移动
w 
(

则若要将w(个错位的数码牌放在其各自的目标位置上, n)步,显然有
n)≤h*(选择w(n), n)≤h*n), 

)。现在, 作为启发函数h(则有h((满
足对h(当选择h(错位数码牌的个数”作为启发函数时,A搜

w(nn) n)=w(

n)上界的要求。因此, n)=“ 
索就是A*搜索。
例3.传教士与野人渡河问题。在河的左岸有
K 
个传教士、
K 
个野人和1条船,传教

4 

士们想用这条船将所有成员都从河左岸运到河右岸去,但有下面的条件和限制: 

(1)所有传教士和野人都会划船。
(2)船的容量为r,即一次最多运送
r 
个人过河。
(3)任何时刻,在河的两岸以及船上的野人数目不能超过传教士的数目,否则野人将吃
掉传教士。
(4)允许在河的某一岸或船上只有野人而没有传教士。
(5)野人会服从传教士的任何过河安排。
请采用A*搜索出一个确保全部成员安全过河的合理方案。
若想解决传教士与野人渡河的问题,首先需要确定问题的表示方法,仍然采用状态空间
表示法;然后设计状态空间、操作算子集合、满足A*搜索的启发函数;最后用定义好启发函
数的A*搜索搜索合理的过河方案。

第一步:设计状态空间表示。

此问题中包括3类对象:传教士、野人和船,采用三元组形式表示一个状态,令S=(m, 
c,b), 其中: 

● 
m 
为未过河的传教士人数,m∈[0,K], 已过河的传教士人数为
K 
-m
。
c∈[-
c
● 
c 
为未过河的野人数,0,
K 
], 已过河的野人数为
K 。
b∈[
● 
b 
为未过河的船数,0,1], 已过河的船数为1b。
初始状态为S0=(
K 
,
K 
,1), 表示全部成员及船都在河的左岸,目标状态为Sg 
=(0,0, 
0), 表示全部成员及船都已到达了河右岸。


56 
第二步:设计操作集合。
根据题意,设计两类操作算子,令Lij操作表示将船从左岸划向右岸,第一下标i 表示船
载的传教士人数,第二下标j 表示船载的野人数;令Rij操作表示将船从右岸划回左岸,下标
的定义同前。这两类操作需满足如下限制:(1)1≤i +j≤r;(2)i ≠0时,i ≥j。
假设K =5,r =3,则合理的操作共有16种,其中船从左岸到右岸的操作有:L01、L02、
L03、L10、L11、L20、L21、L30;船从右岸到左岸的操作有:R01、R02、R03、R10、R11、R20、R21、R30。
第三步:设计满足A* 搜索的启发函数。
若不考虑“野人会吃传教士”的限制,每次3个人(不区分传教士和野人)从左岸到右岸
摆渡过河,然后1个人将船从右岸划回左岸,则至少要单程摆渡9次,这相当于1个人固定
作为船夫,每摆渡一次,只运送1个人过河(即往返一趟,运送2个人过河)。
定义启发函数为:将当前状态下未过河的m 个传道士和c 个野人全部运送到河右岸, 
至少需要摆渡的趟数。那么,是否可以令h(n)=m +c 呢? 分析后发现:不可以。因为
h(n)=m +c 不满足h(n)≤h* (n)的条件。例如:对于状态n (1,1,1),h(n)=m +c= 
2,而此时最短路径上的实际代价h* (n)=1,即只需1趟摆渡即可完成。而此刻,h* (n)= 
1<h(n)=2,不满足A* 搜索的条件。实际上,h* (n)应该有上限:h* (n)≤ m +c,因为
一共有2K 个人,摆渡次数不可能超过2K 次,取h* (n)=m +c。
下面分情况讨论启发函数的选取。
第一种情况:开始时,船与人都在河的左岸,b=1,初始状态为(m ,c,1)。不考虑“野人
会吃传教士”的约束条件,当最后一次恰好3个人同船过河时,效率最高,单独算一次摆渡。
其余m +c-3个人过河,需要摆渡(m +c-3)×2/(r-1)=m +c-3次(r =3),故一共需
要单程摆渡m +c-2次。
第二种情况:开始时,船在右岸,即船与人在河的不同侧,b=0,初始状态为(m ,c,0)。
首先需要额外有1个人将船从右岸划回左岸,消耗1次,同时左岸人数增多1,即总人数变
为m +c+1,转变成第一种情况,即(m +c,0). (m +c+1,1)。根据前面的分析,第一
种情况的初始状态为(m +c,1),一共需要摆渡m +c-2 次。现在,用m +c+1代替(m + 
c,1)中的m +c,则一共需要摆渡m +c-1次,再加上最开始“消耗1次”,则第二种情况共
需要运送(m +c-1)+1=m +c 次。
上述两种情况相结合,得到
h n( ) = 
m +c-2, b=1 
m +c, b=0 { 
可写作h(n)=m +c-2b。此时,h(n)=m +c-2b ≤h* (n)=m +c,满足A* 搜索
对h(n)的限制条件。
第四步:用A* 搜索搜索合理的过河方案。
从初始状态(5,5,1)出发,搜索合理过河方案的搜索图如图3.7所示,其中g 的值表示
已摆渡的次数,从初始状态往下,g 值依次为1~11,每个节点上面都标注了该状态的h 值
和f 值,状态左侧圆圈中的数字表示该节点被扩展的顺序。在搜索的过程中,只有16个状
态被依次扩展了,即按照合理的摆渡操作得到它们的后继节点,因为它们的f 值在当时情
况下最小。而不带圆圈数字的状态表示该节点未被扩展,因为这些节点所表示的状态会出
现“河右岸的野人数多于传教士人数”的现象,不符合要求,故停止此分支的扩展。直到找到

目标状态(0,0,0), 算法结束。该解是最优解,其最小代价为11 。


图3.采用A*搜索解决传教士与野人渡河问题示例

7 

3.局部搜索算法
前面介绍的搜索算法都在内存中保留一条或多条路径,记录路径中在每个节点处的扩
展选择。当找到目标时,从初始节点到达目标节点的路径就是这个问题的一个解。但在许
多问题中,人们并不关注到达目标的路径。例如,在八皇后问题中,人们关注的是最终八个
皇后在棋盘上的布局,而不是摆放皇后的先后次序。许多应用都具有这样的性质,例如车辆


寻径、电信网络优化、集成电路设计、自动程序设计、作业车间调度、工厂场地布局和文件夹
管理等。因此,考虑另外一类算法,它不关心从初始状态到达目标状态的路径,只对一个(当
前状态)或多个(邻近)状态进行评价和修改,称为局部搜索算法。

局部搜索算法适用于那些只关注解状态而不关注路径代价的问题,该类算法从单个当
前节点(而不是多条路径)出发,通常只移动到它的邻近状态。一般情况下,不保留搜索路
径。局部搜索的基本思想是在搜索过程中始终向着离目标最接近的方向搜索。搜索的目标
可以是最大值,也可以是最小值。局部搜索算法有两个主要优点:一是使用很少的内存;二
是在大的或无限(连续)状态空间中能发现合理的解。

本节将介绍3种局部启发式搜索算法:爬山法、模拟退火法和遗传算法。

3.1 
爬山法
4.
爬山法(hil-climbing)是最基本的局部搜索技术。最陡上升版的爬山法是简单的迭代
过程,在每个状态,都是不断地向启发函数值增加最快的方向持续移动,即登高。

爬山法的过程如下:算法从指定的初始状态开始,或任意选择问题的一个初始状态。

然后,在每一步,爬山法都将当前状态
n 
与周围相邻节点的值进行比较,若当前节点值最

大,则返回当前节点,作为最大值,即山峰最高点;否则,从
n 
的所有相邻状态中找到
n 
的最

佳邻接节点,用以代替节点n,成为新的当前状态(此处,最佳邻接节点是启发函数
h 
值最低

的相邻节点)。重复上述过程,直到找到目标为止;或者无法找到进一步改善的状态,算法

结束。

在爬山法中,当前节点都会被它的最佳邻接节点所代替。爬山法不保存搜索树,当前节
点的数据结构只记录当前状态和目标函数值。

爬山法有时被称为贪婪局部搜索,因为它不考虑与当前状态不相邻的状态,总是在相邻

节点(局部范围内)中选择状态最好的一个,也不考虑这个最好状态是否是全局最优的。爬

山法往往很有效,它能很快地朝着解(目标状态)的方向进展,因为它可以很容易地改善一个

不良状态。
h 
(表示当前位置
n 
与山顶之间的高度差,

如果把山顶看作目标,n) 则爬山法相当于总

是朝着山顶的方向前进。在单峰的情况下,必定能到达山顶。在多个山峰的情况下,爬山法

经常会陷入如下3种困境。

(1)局部极大值。
局部极大值(oaxmum) 但却比全局最大值
lclmai是指一个比所有相邻状态值都要高、

要小的状态。爬山法到达局部极大值附近,就会被拉向峰顶,然后就卡在局部极大值处,无

处可走。贪婪算法很难处理陷入局部极(大、小)值的情况。

(2)高原。
在状态空间地形图中,高原(plateau)是一块平原区域,是平原的局部极大值,不存在
上山的出口;或者是山肩, 见图3.

迷路
(
。
3)山脊。
从山肩还有可能取得进展( 8)。爬山法在高原处可能会

山脊(ridge)是由一系列局部极大值构成的,形成了一个不直接相连的局部极大值序
列,如图3.其中的状态( 叠加在从左到右上升的山脊上。爬山法在这样的

9所示, 黑色圆点) 


情况下非常难爬行,从每个局部极大值点出发,可选择的行动都只能是下山的方向。搜索可
能会在山脊的两面来回震荡,前进步伐很小。


图3.8 
局部极大值与高原的示意图9

图3.山脊的示意图

在上述3种情况下,爬山法均无法再取得进展
。
例3.八皇后问题
。


5 

八皇后问题表述为:将八个皇后摆放在8×8的棋盘上,使得任意两个皇后不能互相攻
击,即任意两个皇后都不在同一行、同一列或同一斜线上。

八皇后问题是国际象棋棋手马克斯·贝瑟尔(MaxBezel)于1848年提出的问题,发表
在德国国际象棋杂志Schach 
上。该问题吸引了当时杰出的德国数学家高斯(Gaus)的注
意,他尝试枚举所有可能的解,最初找到了72个解,后来他发现正确答案是92个。实际上, 
纳克(Nauck)于1850年就发表了全部的92个解。若将经过±90度、±180度旋转和对角
线对称变换的摆法看成一类,则共有42类解。后来,将该问题一般化为
N 
皇后问题。

仍然采用状态空间表示法描述八皇后问题,每个状态就是在8×8棋盘上放置八个皇后
的一个布局。设任意两个皇后的坐标分别是(j)和(l),则为使得任意两个皇后不在同

i,k,
一行上,要求j≠l;为使得任意两个皇后不在同一列上,要求i≠k,也可以规定在8×8棋盘
的每一列上只能放置一个皇后;任意两个皇后在同一斜线上的充要条件是|i-k|= 
|j-l|,即两个皇后的行号之差与列号之差的绝对值相等,则为使得任意两皇后不在同一斜
线上,只需要求|i-k|≠|j-l|。

采用爬山法解决八皇后问题,首先需定义启发函数,令h(n)为“相互攻击的皇后对的
数量”。该函数的全局最小值是h=即没有任意两个皇后是互相攻击的, h

0, 仅在找到解时,
值才会等于零。如果有多个最佳后继,爬山法通常会从一组最佳后继中随机选择一个。
假设在初始状态中每列只摆放一个皇后。用爬山法求解八皇后问题的步骤如下。

(1)针对当前状态,计算启发函数
h 
的值。
(2)若h=0,即找到一个解,算法结束;否则,计算各个方格里的
h 
值。
(3)若无法找到比当前状态的
h 
值更小的相邻状态,说明已陷入局部极值,找不到解, 
则算法结束。否则,从若干个小于当前
h 
值的最佳后继中随机挑选一个,将该列的皇后移
到此位置,并转到步骤(2)。
以图3.10中所示的八皇后布局状态图为例,计算该状态的启发函数值h=17,其中每
个方格中显示的数字表示:将这一列中的皇后移到该方格后得到后继的
h 
值。当前棋盘中


最小的
h 
值为12,一共有8个,均用方框圈起来了,表示是最佳移动。如果有多个最佳移

动,即多个最小值,爬山法会从中随机选择一个后继进行扩展。
如图3.当前状态的
h 
值为1, 说明八皇后问题陷

11所示, 其每个后继的
h 
值均大于1, 

入了一个局部极小值。在此情况下,爬山法被卡在局部极(大、小)值处而无法找到全局的最

优解(即h=0),爬山法是不完备的。


图3.10 
八皇后问题的一个状态11

图3.八皇后问题陷入局部极小值的示例

采用最陡上升版爬山法求解八皇后问题,从随机生成的初始状态开始搜索。有实验证
明:在86%的情况下会被卡住,只有14%的问题实例能够被成功求解;算法求解速度快,成
功找到解的平均步数是4步,被卡住的平均步数是3步。

为提高最陡上升版爬山法的求解成功率,提出了随机爬山(stochastichil-climbing)法, 
它是最陡上升版爬山法的变种,是一种局部贪心的最优算法。该算法的主要思想是:在向
上移动的过程中随机地选择下一步,每个状态被选中的概率可能随向上移动陡峭程度的不
同而发生变化。与最陡上升版爬山法相比,随机爬山法不一定选择最陡的路径向上走,所以
收敛速度通常较慢。随机爬山法仍然不完备,还会被局部极大值卡住。

为了进一步改善随机爬山法的性能,又提出了随机重启爬山(random-restarthilclimbing)法。随机重启爬山法的思想是:随机生成一个初始状态,开始搜索,执行一系列这
样的爬山法,直到找到目标为止;若找不到目标,则再随机生成一个初始状态,开始新一轮搜
索……虽然随机重启爬山法依然不完备,但它能以逼近1的概率接近完备,因为它最终会生
成一个目标状态作为初始状态。如果每次爬山法成功的概率为p,则重启需要的期望值是
1/p,即成功的概率越高,需要重启的概率越小。对于八皇后问题,随机重启爬山法实际上
是有效的。即使有300万个皇后,采用这个方法找到解的时间也不超过1分钟。

爬山法成功与否严重依赖于状态空间地形图的形状:如果在图中几乎没有局部极大值
和高原,随机重启爬山法会很快找到一个好的解。

4.模拟退火法
3.2 
爬山法有一个特点,那就是它从来不“下山”,即不会向比当前节点差的(或代价高的)方
向搜索,它是不完备的,因为可能会卡在局部极大值上。而纯粹的随机行走法(random 


walk)的特点是从后继集合中完全等概率地随机选取后继,即可能选择向比当前节点差的
方向搜索。随机行走法是完备的,但是效率极低。因此,将爬山法和随机行走法以某种方式
结合,希望兼顾高效率和完备性,模拟退火法就是这样的算法。

模拟退火法(simulatedannealing,SA)最早的思想是由梅特罗波利斯(N.Metropolis) 
等人于1953年提出的。1983年,柯克帕特里克(S.Kirkpatrick)等人成功地将退火思想引
入组合优化领域,它是基于蒙特卡洛(Monte-Carlo)迭代求解策略的一种随机寻优算法。
“模拟退火”一词来自冶金学的专有名词“退火”。退火是将材料加热后再经特定速率冷却, 
目的是增大晶粒的体积,并减少晶格中的缺陷。材料中的原子本来应该停留在使内能达到
局部极小值之处,但加热使得原子能量变大,原子便会离开原来的位置,在其他位置随机移
动。在退火冷却过程中,原子移动的速度较慢,有较大可能性找到内能比原先更低的位置。
模拟退火法是受金属退火原理启发,将热力学的理论套用到统计学上,将状态空间中的每个
点看作空气中的分子。开始时,算法以搜索空间中任一点作初始状态,每一步都先选择一个
“邻居”,然后再计算从现在的位置到达“邻居”位置的概率。

为了更好地理解模拟退火,有一个形象的比喻:在髙低不平的平面上有个乒乓球,我们
希望乒乓球掉到最深的凹陷处,但它现在却处于某一个浅凹陷处,相当于局部极小值点。如
果只允许乒乓球滚动,那么它只能停留在该浅凹陷中,出不来。如果晃动平面,就可以使乒
乓球弹出浅凹陷处。关键是晃动的力度要适当,既能使得乒乓球从局部极小值处弹出来,又
不能将它从全局最小值处弹出来。模拟退火的解决方法就是开始使劲摇晃(即先高温加
热),然后慢慢降低摇晃的力度(即逐渐降温)。

模拟退火法是一种逼近全局最优解的概率方法,它是允许“下山”的随机爬山法。模拟
退火法的基本思路是:在退火初期,“下山”(即“变坏”)移动容易被采纳,以便摆脱局部极
值;但随着时间的推移,“下山”的次数越来越少,即逐渐减少向“坏”的方向移动的频率。模

拟退火法本质也是一种贪心算法,只不过是以一定的概率来接受更差的状态,这种概率会随
着时间的推移变得越来越小,其优点是可能会让算法跳出局部最优解,最终找到全局最
优解。

模拟退火算法的过程如下。


图3.模拟退火算法

12 

其中,
T 
表示当前“,e()是将时间
t 
映射到温度
T 
的函数;

t 
表示时刻,温度”schedulcurent 


表示当前状态,
t 
表示新状态,ΔE 
表示当前状态与新状态的能量

nexr 
是温度下降的速率,
的差值,其计算公式如下。
ΔE=12)(x) (e) (n) t.le-unVau(1)Vaucret.le 3.

模拟退火法的内层循环(图3.与爬山法类似,只是它不选择最佳移动,而是进行随机
移动。若该移动可改善情况,即ΔE>0,说明新状态比当前状态要好,则接受该移动,并用
新状态代替当前状态;否则,若ΔE≤0,说明新状态比当前状态要差,模拟退火法并不会像

r

爬山法一样丢弃这个新状态,而是以某个小于1的概率
P 
=eΔE/(T)接受“变坏”的新状态。
直到温度
T 
降至0,返回当前状态作为一个解,算法结束。

在模拟退火法刚开始时,温度
T 
较高,接受“变坏”的后继状态的概率较大,随着时间的
推移,
T 
逐渐下降,算法接受一个“变坏”的后继状态的概率就越来越小。可见,接受“变坏” 
移动的概率是随着“温度”
T 
的降低而下降的。如果调度使温度
T 
下降得足够慢,那么模拟
退火法找到全局最优解的概率就可以接近于1。
即可
采用模拟退火法求解八皇后问题
。
h(n)
,关键是设计启发函数
n。
) 
选择启发函数
3.1h)
(n)=相互
lue攻击的皇后对的数量,值越小,说明状态越好。用h(代替公式(中的Va

模拟退火法是一种通用的优化算法,理论上讲,该算法具有概率接近1的全局优化性
能。模拟退火法在20世纪80年代早期被广泛用于求解大规模集成电路(verylargescale 
integrationcircuit,VLSI)布局问题。目前它已经广泛地应用于VLSI 、生产调度、控制工程、
机器学习、神经网络、信号处理等领域的最优化任务中。

3.3 
遗传算法
4.
20世纪60年代末,美国密歇根大学的约翰·霍兰德(JohnHoland)教授受达尔文“物
竞天择,适者生存”进化论思想的启发,提出了模拟自然选择和遗传学机理的生物进化过程
的计算模型,通过模仿自然进化过程来搜索复杂问题的最优解,这就是求解优化问题的遗传
算法(geneticalgorithm,GA )。

遗传算法是一种启发式随机搜索算法,它通过数学的方式,利用计算机仿真运算,模仿
生物遗传和进化过程中的染色体基因选择、交叉、变异机理,来完成自适应搜索问题最优解
的过程。求解较为复杂的组合优化问题时,遗传算法通常能比一些常规优化算法更快地获
得较好的优化结果。自从20世纪80年代起,遗传算法已成为研究热点,被人们广泛地应用
于组合优化、机器学习、信号处理、生产调度问题、图像处理、自动控制和人工生命等领域。

3.3.遗传算法的基本概念
4.1 
在遗传算法中,后继节点是由两个父辈状态组合生成的,而不是对单一状态修改而得到
的。其处理过程是有性繁殖,而不是无性繁殖。
遗传算法借鉴生物进化中“适者生存”的理论,定义了如下一些术语。

(1)个体(l):个体就是遗传算法要处理的染色体,组成染色体的元素称为基
individua
因。染色体中的每一位就是一个基因,基因的位置称为基因座,基因的取值称为等位基因。
基因决定了染色体的特征,也决定了个体的性状,如眼睛的颜色是黑色、栗色或者蓝色等。

(2)种群(population):种群是由若干个个体(即染色体)组成的集合。一个种群中个

体的个数称为该种群的规模。种群规模会影响遗传优化的结果和效率。大的种群中含有丰
富的个体模式,可以改进遗传算法的搜索质量,防止早熟收敛(算法较早地收敛于局部最优
解,称为早熟收敛)。但大的种群也增加了个体适应度函数的计算量,从而降低了收敛速度。
一般种群规模选取在[20,100]的值。

(3)适应度(ins)用一个估计
fte:适应度是指个体对环境的适应程度。在优化问题中, 
函数来度量个体的适应度,这个函数称为适应度函数。适应度函数值是遗传算法实现优胜
劣汰的主要依据。个体适应度的值越大,说明该个体的状态越好,竞争能力越强,被选择参
与遗传操作来产生新个体的可能性就越大,以此体现生物遗传中适者生存的原理。

3.3.编码
4.2 

对一个要应用遗传算法求解的具体问题,首先要考虑的问题就是如何编码,因为遗传算
法不能直接处理问题空间的数据,必须通过编码将要求解的问题表示成遗传空间的染色体
或个体。在计算机中,染色体被表示为一个用来描述基本遗传结构的数据结构。尚不存在
一种针对所有问题都适合的通用编码方法,往往需要具体问题具体分析,选择最适合的方
法。下面介绍3种常用的编码方法。

(1)二进制编码。
二进制编码就是用一个二进制的字符串表示一个个体,其中每个0或1为等位基因。
染色体上由若干个基因构成的一个有效信息段称为基因组。例如,11011为一个染色体,每
一位上的0或1表示基因,前3个基因就构成了一个基因组110 。

二进制编码使得交叉、变异等遗传操作易于实现,但在求解高维优化问题时,二进制编
码串会很长,将导致遗传算法的搜索效率很低。

(2)实数编码。
为了克服二进制编码的缺点,在问题变量是实向量的情况下,可直接采用十进制编码, 
即为实数编码。实数编码就是用一个十进制的字符串表示一个个体,然后在实数空间上进
行遗传操作。采用实数编码,则不必进行数制转换,便于引入与问题领域相关的启发式信息
来增加算法的搜索能力。近年来,遗传算法在求解高维或复杂优化问题时,一般都采用实数
编码。

(3)有序编码。
有序编码也叫序列编码、排列编码,是针对一些特殊问题的特定编码方式。该编码方式
排列有限集合内的元素。若集合内包含
m 
个元素,则存在m! 种排列方法,当
m 
不大时, 
m!也不会太大,采用穷举法就可以解决问题。当
m 
比较大时,m!就会非常大,穷举法失
效,遗传算法在解决这类问题上具有优势。

针对很多组合优化问题,目标函数的值不仅与表示解的字符串中各字符的值有关,而且
与其所在字符串中的位置有关。这样的问题称为有序问题。若目标函数的值只与表示解的
字符串中各字符的位置有关,而与具体的字符值无关,则称为纯有序问题,如八皇后问题。

有序编码的优点是使问题简洁,易于理解,编码自然、合理。

3.3.种群设定
4.3 
由于遗传算法是对种群进行操作的,因此需要为遗传操作构造一个由若干个个体组成


的初始种群。初始种群中的个体一般是随机产生的。假设设定种群规模为
M 
,首先随机生
成一定数目(通常为2M 
)的个体,然后从中挑选较好的
M 
个个体,构成初始种群。

3.3.适应度函数的设计
4.4 

适应度函数的设计直接影响遗传算法的收敛速度以及能否找到最优解,因为遗传算法
在进化搜索中基本不利用外部信息,仅根据适应度函数来评价种群中每个个体适应性的优
劣。在遗传算法中,适应度函数值规定为非负,并且在任何情况下都希望其值越大越好。在
具体应用中,适应度函数的设计要结合待求解问题本身的要求而定。一般而言,适应度函数
是由待求解优化问题的目标函数变换得到的。

若问题的目标函数f(x)为最大化问题,则适应度函数可以取为
Fit(x))f((2)

f(=x)3.
若问题的目标函数f(x)为最小化问题,则适应度函数可以取为
Fit(x))=f(x) (3.

f 
(1/3) 

3.3.遗传操作
4.5 

遗传操作(geneticoperator)可作用于种群,用于产生新的种群。标准的遗传操作一般
包括以下3种基本形式:选择、交叉及变异。
selectioreproductio

(1)选择(n)操作,也称为复制(n), 是从当前种群中按照一定概率选
出的优良个体,使它们有机会作为父代繁殖下一代。选择操作的目的是使种群优胜劣汰、不
断进化,并且提高种群的收敛速度和搜索效率。根据个体的适应度值来判断其优劣,适应度
值越高,越具有优良性,该个体被选择的机会就越大,显然这一操作借鉴了达尔文“适者生
存”的进化原则。优胜劣汰的选择机制使得适应度值大的个体具有较高的存活概率,这是遗
传算法与一般搜索算法的主要区别之一。
实现选择操作的方法有很多,不同的选择策略对算法的性能也有较大的影响。最常用
的选择方法称为“轮盘赌”方法,它按照适应度比例模型(也称为蒙特卡洛法)计算个体被选
择的概率,设种群规模大小为
M 
,个体
i 
的适应度值为fi,则这个个体被选择的概率为

Pi= 
fi 
(4)

3.
fjΣ(M) 
j=1 

每个个体被选择的概率与其适应度值成正比。如表3.4) 
第2行给出了6个个体

1所示, 

的适应度值,第3行是根据公式(3.计算出的每个个体的选择

概率,总和为1,第4行是前
i 
个个体的累计概率。在轮盘选择

方法中,先按个体的选择概率产生一个轮盘,1中列

假设有表3.
出的6个个体,故轮盘分为6个区域, 13 所示,

如图3.每个区域
代表一个个体,其大小与该个体的选择概率成正比,即第
i 
个
扇形的中心角为2πPi;然后产生一个位于[0,1]的随机数,它
落入轮盘的哪个区域,就选择该区域所对应的个体,进行交叉。

13 

图3.轮盘赌示意图
显然,选择概率大的个体所对应的区域面积也大,该个体被选
中的可能性就大,获得交叉的机会也大。



65 

实现选择操作时,产生了一个随机数
r 
后,若p1+p2+…+pi-1<
r 
<p1+p2+…+ 
pi,则选择个体i,即找到第一个累计概率大于
r 
的个体,1为

作为被选择的个体。以表3.
例,假设第1轮产生的随机数为0.由于个体x3 对应的累计概率0.7

7, 82是第一个大于0.
的值,则个体x3 被选中; 9, 94是

第2轮产生的随机数为0.由于个体x4 对应的累计概率0.
第一个大于0.9的值,则个体x4 被选中。选择操作确定了被选个体后,才能对所选中的个
体进行交叉、变异等操作,产生的新个体。

表3.1 
个体适应度值、选择概率和累计概率

个体编号
x1 
x2 
x3 
x4 
x5 
x6 
适应度值3.6 3.1 2.3 1.35 0.6 0.12 
选择概率0.33 0.28 0.21 0.12 0.05 0.01 
累计概率0.33 0.61 0.82 0.94 0.99 1.00 

(2)交叉(crosover)操作,也称为重组(recombination)操作,是遗传算法中的核心操
作。交叉是分别用两个父代个体的部分基因片段重组为新的子代的操作,使父代的优良特
征能传递给子代,并产生新的特性。由交叉操作得到的子代个体构成了新种群,其中个体适
应度的平均值和最大值均比父代有明显提高。交叉是遗传算法中获得比父代更优秀的个体
的最重要手段。
最简单、最常见的交叉操作是单点交叉,其具体做法是:假设父辈染色体位串长度为
L,随机选取[1,L-1]中一个整数
k 
作为交叉点,将两个父代个体在交叉点处截断,相互交
换各自的染色体片段,从而形成一对新的子代个体。例如,假设采用二进制字符串表示染色
体,对于x1=10110011和x2=01100101两个父代染色体,随机产生一个交配位,设为3,则
x1 和x2 分别在各自的第3位基因之后断开,进行交换,产生两个子代染色体,分别为y1= 
10100101和y2=01110011 。

在进化过程中,交叉并非百分之百地发生,而是以某一概率发生,这个概率称为交叉概
率。交叉概率Pc 
控制着交叉算子的应用频率,在每代种群中,都需要对
M 
×Pc 
个个体的
染色体结构进行交叉操作。交叉概率越大,在种群中引入新的染色体结构的速度就越快,但
优良基因结构遭到破坏的可能性也相应增大;若交叉概率太低,则可能导致早熟收敛。一般
Pc 
在[6,1.取值, 
c 
取0.搜索结果比较理想。

0.00] 实验表明P7左右时, 
当交叉操作产生的后代的适应度不再比其父代高、且未找到全局最优解时,算法会较早
地收敛于局部最优解,称为早熟收敛。其根源是发生了有效等位基因的缺失,即缺失了最优
解位串上的等位基因。若想要跳出局部最优,只有进行变异操作,即添加随机化特征或添加
扰动等,才能改变这种情况。

(3)变异(mutation)是随机改变个体编码中某些位的基因值的操作,从而产生新一代
的个体。变异操作是按位进行的,即对某一位的内容进行变异。变异的主要目的是保持种
群的多样性,对选择、交叉过程中可能丢失的某些遗传基因进行修复和补充。当发生早熟收
敛时,可利用变异跳出局部最优解的陷阱。变异操作不仅可以保证实现搜索的目标,而且可
以提高搜索的效率。