第5章〓图论算法
图状结构是一种比树结构更复杂的非线性数据结构。在树结构中,结点间具有分支层次关系,每一层上的结点只能和上一层中的至多一个结点相关,但可能和下一层的多个结点相关。而在图状结构中,任意两个结点之间都可能相关,即结点之间的邻接关系可以是任意的。因此,图状结构被用于描述各种复杂的数据对象,在自然科学、社会科学和人文科学等许多领域有着非常广泛的应用,与之相关的实现算法会影响到许多实际应用问题的算法效率。

随着互联网和物联网的快速发展，未来的世界将会是一个更加智能化、生态化、自动化和便捷化的“万物互联”世界。数字城市、智慧交通、智能医疗等，将现实世界不同领域抽象成一个个的图状结构，利用图的最小生成树算法，可以建设低成本的通信网络和交通网络，进行最佳旅游景点路线规划，优化城市天然气管道铺设布局等； 图的最短路径算法，可以实现最优的物流运输的路径，降低物流成本，还可以应用于自然灾害、矿井、航空等突发事件的应急救援中，以减少生命及财产损失。



观看视频






观看视频



5.1图

5.1.1图的定义和术语
1. 图的定义

图(Graph)由非空的顶点集合和一个描述顶点之间关系——边(或者弧)的集合组成,其形式化定义为

G(V,E)

V{vi| vi∈dataobject}

E{( vi,vj)| vi, vj ∈V ∧P(vi, vj)}

其中,G表示一幅图； V是图G中顶点的集合； E是图G中边的集合； 集合E中P(vi,vj)表示顶点vi和顶点vj之间有一条直接连线,即偶对(vi,vj)表示一条边。图5.1给出了一幅图的示例,在该图中： 

集合V{v1,v2,v3,v4,v5}

集合E{(v1,v2),(v1,v4),(v2,v3),(v3,v4),(v3,v5),(v2,v5)}

2. 图的相关术语

(1) 无向图。在一幅图中,如果任意两个顶点构成的偶对(vi, vj)∈E是无序的,即顶点之间的连线是没有方向的,则称该图为无向图。如图5.1所示是一幅无向图G1。

(2) 有向图。在一幅图中,如果任意两个顶点构成的偶对(vi, vj)∈E是有序的,即顶点之间的连线是有方向的,则称该图为有向图。如图5.2所示是一幅有向图G2。

G2 (V2,E2)
V2{v1,v2,v3,v4}
E2{v1,v2,v1,v3,v3,v4,v4,v1}




图5.1无向图G1




图5.2有向图G2



(3) 顶点、边、弧、弧头、弧尾。图中,数据元素vi称为顶点(Vertex); P(vi, vj)表示在顶点vi和顶点vj之间有一条直接连线。如果是在无向图中,则称这条连线为边; 如果是在有向图中,一般称这条连线为弧。边用顶点的无序偶对(vi, vj)来表示,称顶点vi和顶点vj互为邻接点,边(vi, vj)依附于顶点vi与顶点vj; 弧用顶点的有序偶对vi, vj来表示,有序偶对的第一个结点vi被称为始点(或弧尾),在图中就是不带箭头的一端; 有序偶对的第二个结点vj被称为终点(或弧头),在图中就是带箭头的一端。

(4) 无向完全图。在一幅无向图中,如果任意两个顶点都有一条直接边相连接,则称该图为无向完全图。可以证明,在一幅含有n个顶点的无向完全图中,有n(n1)/2条边。

(5) 有向完全图。在一幅有向图中,如果任意两个顶点之间都有方向互为相反的两条弧相连接,则称该图为有向完全图。在一幅含有n个顶点的有向完全图中,有n(n1)条边。

(6) 稠密图、稀疏图。若一幅图接近完全图,称为稠密图; 称边数很少的图为稀疏图。

(7) 顶点的度、入度、出度。顶点的度(Degree)指依附于某顶点v的边数,通常记为TD(v)。在有向图中,要区别顶点的入度与出度的概念。顶点v的入度指以顶点为终点的弧的数目，记为ID(v); 顶点v的出度指以顶点v为始点的弧的数目,记为OD(v)。有TD(v)ID(v)OD(v)。

例如,在G1中有

TD(v1)2TD(v2)3TD(v3)3TD(v4)2TD(v5)2

在G2中有

ID(v1)1OD(v1)2TD(v1)3

ID(v2)1OD(v2)0TD(v2)1

ID(v3)1OD(v3)1TD(v3)2

ID(v4)1OD(v4)1TD(v4)2

可以证明,对于具有n个顶点、e条边的图,顶点vi的度TD(vi)与顶点的个数以及边的数目满足关系： 

e∑ni1TD(vi)2



观看视频


(8) 边的权、网图。与边有关的数据信息称为权(Weight)。在实际应用中,权值可以有某种含义。例如,在一幅反映城市交通线路的图中,边上的权值可以表示该条线路的长度或者等级; 对于一幅电子线路图,边上的权值可以表示两个端点之间的电阻、电流或电压值; 对于反映工程进度的图而言,边上的权值可以表示从前一个工程到后一个工程所需要的时间等。边上带权的图称为网图或网络(Network)。如图5.3所示就是一幅无向网图。如果边是有方向的带权图,则就是一幅有向网图。

(9) 路径、路径长度。顶点vp到顶点vq之间的路径(Path)指顶点序列vp,vi1,vi2,…, vim,vq。其中,(vp,vi1),(vi1,vi2),…,(vim,vq)分别为图中的边。路径上边的数目称为路径长度。在图5.1所示的无向图G1中,v1→v4→v3→v5与v1→v2→v5是从顶点v1到顶点v5的两条路径,路径长度分别为3和2。

(10) 回路、简单路径、简单回路。第一个顶点和最后一个顶点相同的路径称为回路或者环(Cycle)。序列中顶点不重复出现的路径称为简单路径。在图5.1中,前面提到的v1到v5的两条路径都为简单路径。除第一个顶点与最后一个顶点之外,其他顶点不重复出现的回路称为简单回路,或者简单环。如图5.2中所示的v1→v3→v4→v1。

(11) 子图。对于图G (V,E),G′ (V′,E′),若存在V′是V的子集,E′是E的子集,则称图G′是G的一幅子图。图5.4分别给出了G2和G1的两个子图G′和G″。

(12) 连通的、连通图、连通分量。在无向图中,如果从一个顶点vi到另一个顶点vj(ij)有路径,则称顶点vi和vj是连通的。如果图中任意两个顶点都是连通的,则称该图是连通图。无向图的极大连通子图称为连通分量。图5.5(a)中有两个连通分量，如图5.5(b)所示。




图5.3一幅无向网图示意




图5.4图G2和G1的两幅子图示意



(13) 强连通图、强连通分量。对于有向图来说,若图中任意一对顶点vi和vj(ij)均有从一个顶点vi到另一个顶点vj的路径,也有从vj到vi的路径,则称该有向图是强连通图。有向图的极大强连通子图称为强连通分量。图5.2中有两个强连通分量,分别是{v1, v3, v4}和{v2},如图5.6所示。

(14) 生成树。所谓连通图G的生成树,指包含G的全部n个顶点的一幅极小连通子图。它必定包含且仅包含G的n1条边。图5.4(b)给出了图5.1中G1的一棵生成树。在生成树中添加任意一条属于原图中的边必定会产生回路,因为新添加的边使其所依附的两个顶点之间有了第二条路径。若生成树中减少任意一条边,则必然成为非连通的。




图5.5无向图及连通分量示意




图5.6有向图G2的两个强连通分量示意



(15) 生成森林。在非连通图中,由每个连通分量都可得到一幅极小连通子图,即一棵生成树,这些连通分量的生成树就组成了一幅非连通图的生成森林。



观看视频


5.1.2图的抽象数据类型

图的抽象数据类型定义如下。

ADT Graph{

数据对象V： V是具有相同特性的数据元素的集合,称为顶点集。

数据关系R： R=｛VR｝。

VR=｛v,w|v,w∈V且P(v,w),v,w表示从v到w的弧,谓词P(v,w)定义了弧v,w的意义或信息｝。

基本操作如下。

(1) CreateGraph(&G,V,VR)： 按V和VR的定义构造图G。

(2) DestroyGraph(&G)： 销毁图G。

(3) Locatevex(G,u)： 若G中存在顶点u,则返回该顶点在图中的位置; 否则返回其他信息。

(4) Getvex(G,v)： 返回顶点v的值。

(5) PutVex(&G,v,value)： 对顶点v赋值value。

(6) FirstAdjVex(G,v)： 返回顶点v的第一个邻接顶点。若顶点在G中没有邻接顶点,则返回"空"。

(7) NextAdjVex(G,v,w)： 返回顶点v的(相对于w的)下一个邻接顶点。若w是v的最后一个邻接点,则返回"空"。

(8) InsertVex(&G,v)： 在图G中增添新顶点v。

(9) DeleteVex(&G,v,w)： 删除G中顶点v及其相关的弧。

(10) InsertArc(&G,v,w)： 在G中增添弧v,w,若G是有向的,则还增添对称弧w,v。

(11) DeleteArc(&G,v,w)： 在G中删除弧v,w,若G是有向的,则还删除对称弧w,v。

(12) DFSTraverse(G,Visit())： 对图进行深度优先遍历。在遍历过程中对每个顶点调用函数Visit（）一次且仅一次。一旦Visit()失败,则操作失败。

(13) BFSTraverse(G,Visit())： 对图进行广度优先遍历。在遍历过程中对每个顶点调用函数Visit（）一次且仅一次。一旦Visit()失败,则操作失败。

}ADT Graph



观看视频


5.1.3图的存储结构

图是一种结构复杂的数据结构,表现在不仅各顶点的度可以千差万别,而且顶点之间的逻辑关系也错综复杂。从图的定义可知,一幅图的信息包括两部分,即图中顶点的信息以及描述顶点之间的关系(边或者弧的信息)。因此无论采用什么方法建立图的存储结构,都要完整、准确地反映这两方面的信息。

1. 邻接矩阵

邻接矩阵(Adjacency Matrix)的存储结构就是用一维数组存储图中顶点的信息,用矩阵表示图中各顶点之间的邻接关系。如图5.7所示，假设图G(V,E)有n个确定的顶点,即V{v0,v1,…,vn1},则表示G中各顶点相邻关系为一个n×n的矩阵,矩阵的元素为

A［i］［j］ 1，(vi,vj)或vi,vj是E(G)中的边0，(vi,vj)或vi,vj不是E(G)中的边

如图5.8所示，若G是网图,则邻接矩阵可定义为

A［i］［j］ wij，(vi,vj)或vi,vj是E(G)中的边0或∞，(vi,vj)或vi,vj不是E(G)中的边

其中，wij表示边(vi,vj)或vi,vj上的权值; ∞表示一个计算机允许的、大于所有边上权值的数。




图5.7一幅无向图的邻接矩阵表示




图5.8一幅网图的邻接矩阵表示



从图的邻接矩阵存储方法容易看出这种表示具有以下特点。

(1) 无向图的邻接矩阵一定是一个对称矩阵。因此,在具体存放邻接矩阵时只需存放上三角(或下三角)矩阵的元素即可。

(2) 对于无向图,邻接矩阵的第i行(或第i列)非零元素(或非∞元素)的个数正好是第i个顶点的度TD(vi)。

(3) 对于有向图,邻接矩阵的第i行(或第i列)非零元素(或非∞元素)的个数正好是第i个顶点的出度OD(vi)(或入度ID(vi))。

(4) 用邻接矩阵方法存储图,很容易确定图中任意两个顶点之间是否有边相连; 但是,要确定图中有多少条边,则必须按行、按列对每个元素进行检测,所花费的时间代价很大。这是用邻接矩阵存储图的局限性。

在用邻接矩阵存储图时,除用一个二维数组存储用于表示顶点间相邻关系的邻接矩阵外,还需用一个一维数组来存储顶点信息,另外还有图的顶点数和边数。故可将其形式描述如下。

#define MaxVertexNum 100/*最大顶点数设为100*/

typedef char VertexType;           /*顶点类型设为字符型*/

typedef int EdgeType;              /*边的权值设为整型*/

typedef struct {

VertexType vexs［MaxVertexNum］; 　　/*顶点表*/

EdgeType edges［MaxVertexNum］［MaxVertexNum］; 　　/*邻接矩阵,即边表*/

int n,e;                       /*顶点数和边数*/

}MGragh;                      /*MGragh是以邻接矩阵存储的图类型*/

建立一幅图的邻接矩阵存储的算法如下。

算法5.1建立有向图的邻接矩阵存储

void CreateMGraph(MGraph *G)

{  /*建立有向图G的邻接矩阵存储*/

int i,j,k,w;

char ch;

printf("请输入顶点数和边数(输入格式为:顶点数,边数):＼n");

scanf("%d,%d",&(G->n),&(G->e));	　　/*输入顶点数和边数*/

printf("请输入顶点信息(输入格式为:顶点号<CR>):＼n");

for (i=0;i<G->n;i++)  scanf("＼n%c",&(G->vexs［i］));  
/*输入顶点信息,建立顶点表*/

for (i=0;i<G->n;i++)

 for (j=0;j<G->n;j++)  G->edges［i］［j］=0;     　　/*初始化邻接矩阵*/

printf("请输入每条边对应的两个顶点的序号(输入格式为:i,j):＼n");

for (k=0;k<G->e;k++)

{  scanf("＼n%d,%d",&i,&j);       /*输入e条边,建立邻接矩阵*/

G->edges［i］［j］=1;             /*若加入G->edges［j］［i］=1;,*/

/*则建立完整的无向图邻接矩阵*/

}

}/*CreateMGraph*/

2.  邻接表

邻接表(Adjacency List)是图的一种顺序存储与链式存储结合的存储方法。邻接表表示法类似于树的孩子链表表示法。就是对于图G中的每个顶点vi,将所有邻接于vi的顶点vj链成一个单链表,这个单链表就称为顶点vi的邻接表,再将所有顶点的邻接表表头放到数组中,就构成了图的邻接表。在邻接表表示中有两种结点结构,如图5.9所示。

一种是顶点表的结点结构,它由顶点域(vertex)和指向第一条邻接边的指针域(firstedge)构成,另一种是边表(即邻接表)结点,它由邻接点域(adjvex)和指向下一条邻接边的指针域(next)构成。对于网图的边表需再增设一个存储边上权值信息的域(info)。网图的边表结构如图5.10所示。





图5.9邻接矩阵表示的结点结构







邻接点域边上权值信息的域指针域

adjvexinfonext


图5.10网图的边表结构




图5.11给出了无向图5.7对应的邻接表表示。


邻接表表示的形式描述如下。

＃define MaxVerNum 100          /*最大顶点数为100*/

typedef struct node{               /*边表结点*/

int adjvex;                   /*邻接点域*/

struct node  * next;         /*指向下一个邻接点的指针域*/

/*若要表示边上信息,则应增加一个数据域info*/

}EdgeNode;        

typedef struct vnode{              /*顶点表结点*/

VertexType vertex;          /*顶点域*/

EdgeNode  * firstedge;      /*边表头指针*/

}VertexNode;       

typedef VertexNode AdjList［MaxVertexNum］;  /*AdjList是邻接表类型*/

typedef struct{  

AdjList adjlist;                /*邻接表*/

int n,e;                     /*顶点数和边数*/

}ALGraph;                   /*ALGraph是以邻接表方式存储的图类型*/



图5.11图的邻接表表示


建立一个有向图的邻接表存储的算法如下。

算法5.2建立有向图的邻接表存储

void CreateALGraph(ALGraph *G)

{/*建立有向图的邻接表存储*/

int i,j,k;

EdgeNode * s;

printf("请输入顶点数和边数(输入格式为:顶点数,边数)： ＼n");

scanf("%d,%d",&(G->n),&(G->e));  /*读入顶点数和边数*/

printf("请输入顶点信息(输入格式为:顶点号<CR>)： ＼n");

for (i=0;i<G->n;i++)              /*建立有n个顶点的顶点表*/

{  scanf("＼n%c",&(G->adjlist［i］.vertex));  /*读入顶点信息*/

G->adjlist［i］.firstedge=NULL;        /*顶点的边表头指针设为空*/

}

printf("请输入边的信息(输入格式为:i,j)： ＼n");

for (k=0;k<G->e;k++)             /*建立边表*/

{  scanf("＼n%d,%d",&i,&j);        /*读入边<vi,vj>的顶点对应序号*/

s=(EdgeNode*)malloc(sizeof(EdgeNode));/*生成新边表结点s*/

s->adjvex=j;                      /*邻接点序号为j*/

s->next=G->adjlist［i］.firstedge;      /*将新边表结点s插入顶点vi的边表头部*/

G->adjlist［i］.firstedge=s;

}

}/*CreateALGraph*/

若无向图中有n个顶点、e条边,则它的邻接表需n个头结点和2e个表结点。显然,在边稀疏(e<<n(n1)/2)的情况下,用邻接表表示图比邻接矩阵节省存储空间,当和边相关的信息较多时更是如此。

在无向图的邻接表中,顶点vi的度恰为第i个链表中的结点数; 而在有向图中,第i个链表中的结点个数只是顶点vi的出度,为求入度,必须遍历整个邻接表。在所有链表中其邻接点域的值为i的结点的个数是顶点vi的入度。有时,为了便于确定顶点的入度或以顶点vi为头的弧,可以建立一个有向图的逆邻接表,即对每个顶点vi建立一个链接以vi为头的弧的链表。例如，图5.12所示为有向图G2(图5.2)的邻接表和逆邻接表。



图5.12图5.2的邻接表和逆邻接表



在建立邻接表或逆邻接表时,若输入的顶点信息为顶点的编号,则建立邻接表的时间复杂度为O(ne)； 否则,需要通过查找才能得到顶点在图中的位置,时间复杂度为O(n*e)。

在邻接表上容易找到任一顶点的第一个邻接点和下一个邻接点,但要判定任意两个顶点(vi和vj)之间是否有边或弧相连,则需搜索第i个或第j个链表,因此,不及邻接矩阵方便。



观看视频


3.  十字链表

十字链表(Orthogonal List)是有向图的一种存储方法,它实际上是邻接表与逆邻接表的结合,即把每一条边的边结点分别组织到以弧尾顶点为头结点的链表和以弧头顶点为头顶点的链表中。在十字链表表示中,顶点表和边表的结点结构分别如图5.13(a)和图5.13(b)所示。




顶点值域指针域指针域

vertexfirstinfirstout

(a) 十字链表顶点表的结点结构



弧尾结点弧头结点弧上信息指针域指针域

tailvexheadvexinfohlinktlink

(b) 十字链表边表的结点结构


图5.13十字链表顶点表、边表的结点结构示意


在弧结点中有5个域，其中弧尾结点(tailvex)和弧头结点(headvex)分别指示弧尾和弧头这两个顶点在图中的位置,指针域hlink指向弧头相同的下一条弧,指针域tlink指向弧尾相同的下一条弧,info域指向该弧的相关信息。弧头相同的弧在同一链表上,弧尾相同的弧也在同一链表上。它们的头结点即为顶点结点,它由3个域组成： vertex域存储和顶点相关的信息,如顶点的名称等; firstin和firstout为两个链域,分别指向以该顶点为弧头或弧尾的第一个弧结点。例如,图5.14(a)中所示有向图的十字链表如图5.14(b)所示。若将有向图的邻接矩阵看成稀疏矩阵,则十字链表也可以看成邻接矩阵的链表存储结构。在图的十字链表中,弧结点所在的链表为非循环链表,结点之间相对位置自然形成,不一定按顶点序号有序,表头结点即顶点结点,它们之间是顺序存储的。



图5.14有向图及其十字链表表示示意


有向图的十字链表存储表示的形式描述如下。

#define  MAX_VERTEX_NUM 20

typedef struct ArcBox {

int tailvex,headvex;  　　/*该弧的尾和头顶点的位置*/

struct  ArcBox  * hlink, tlink;	 /*分别为弧头相同和弧尾相同的弧的链域*/

InfoType   info;   　　/*该弧相关信息的指针*/

}ArcBox;

typedef struct VexNode {

VertexType vertex:

ArcBox  fisrin, firstout;  /*分别指向该顶点的第一条入弧和出弧*/

}VexNode;

typedef struct {

VexNode xlist［MAX_VERTEX_NUM］; /*表头向量*/

int  vexnum,arcnum;  /*有向图的顶点数和弧数*/

}OLGraph;

下面给出建立一个有向图的十字链表存储的算法。通过该算法,只要输入n个顶点的信息和e条弧的信息,便可建立该有向图的十字链表,其算法如下。

算法5.3建立有向图的十字链表

void CreateDG(LOGraph **G)

/*采用十字链表表示,构造有向图G(G.kind=DG)*/

{scanf(&(*G->brcnum),&(*G->arcnum),&IncInfo);   
/*IncInfo为0则各弧不含信息*/

for (i=0;i<*G->vexnum;++i)                     /*构造表头向量*/

{ scanf(&(G->xlist［i］.vertex));                   /*输入顶点值*/

*G->xlist［i］.firstin=NulL;*G->xlist［i］.firstout =NULL;  /*初始化指针*/

}

for(k=0;k<G.arcnum;++k)                       /*输入各弧并构造十字链表*/

{  scanf(&v1,&v2);                             /*输入一条弧的始点和终点*/

i=LocateVex(*G,v1);  j=LocateVex(*G,v2);       /*确定v1和v2在G中的位置*/

p=(ArcBox*) malloc(sizeof(ArcBox));            /*假定有足够的空间*/

*p={i,j,*G->xlist［j］.fistin,*G->xlist［i］.firstout,NULL} 
/*对弧结点赋值*/

/*{tailvex,headvex,hlink,tlink,info}*/

*G->xlist［j］.fisrtin=*G->xlist［i］.firstout=p;      
/*完成在入弧和出弧链头的插入*/

if (IncInfo) Input( p->info);                      /*若弧含有相关信息,则输入*/

}

}/*CreateDG*/

在十字链表中既容易找到以vi为尾的弧,也容易找到以vi为头的弧,因而容易求得顶点的出度和入度(或视需要在建立十字链表的同时求出)。同时,由算法5.3可知,建立十字链表的时间复杂度和建立邻接表是相同的。在某些有向图的应用中,十字链表是很有用的工具。

4.  邻接多重表

邻接多重表(Adjacency Multilist)主要用于存储无向图。因为,如果用邻接表存储无向图,那么每条边的两个边结点分别在以该边所依附的两个顶点为头结点的链表中,这会给图的某些操作带来不便。例如,对已访问过的边进行标记,或者要删除图中某一条边等,都需要找到表示同一条边的两个结点。因此,在进行这一类操作的无向图的问题中采用邻接多重表作存储结构更为适宜。

邻接多重表的存储结构和十字链表类似,也是由顶点表和边表组成的,每条边用一个结点表示,其顶点表结点结构和边表结点结构如图5.15所示。





顶点值域指针域

vertexfirstedge

(a) 邻接多重表的顶点表结点结构



标记域顶点位置指针域顶点位置指针域边上信息

markivexilinkjvexjlinkinfo

(b) 邻接多重表的边表结点结构


图5.15邻接多重表顶点表、边表的结点结构示意


其中,顶点表由两个域组成,vertex域存储和该顶点相关的信息,firstedge域指示第一条依附于该顶点的边。边表结点由6个域组成,mark为标记域,可用于标记该条边是否被搜索过; ivex和jvex为该边依附的两个顶点在图中的位置; ilink指向下一条依附于顶点ivex的边;jlink指向下一条依附于顶点jvex的边； info为指向和边相关的各种信息的指针域。

例如,图5.16所示为无向图5.1的邻接多重表。在邻接多重表中,所有依附于同一顶点的边串联在同一链表中,由于每条边依附于两个顶点,因此每个边结点同时链接在两个链表中。可见,对无向图而言,其邻接多重表和邻接表的差别仅仅在于同一条边在邻接表中用两个结点表示,而在邻接多重表中只有一个结点。因此,除在边结点中增加一个标志域外,邻接多重表所需的存储量和邻接表相同。在邻接多重表上,各种基本操作的实现也和邻接表相似。邻接多重表存储表示的形式描述如下。

#define MAX_VERTEX_NUM 20

typedef emnu{unvisited,visited} VisitIf;

typedef struct EBox{

VisitIf mark:            /*访问标记*/

int ivex,jvex;            /*该边依附的两个顶点的位置*/

struct EBox ilink, jlink;   /*分别指向依附这两个顶点的下一条边*/

InfoType  info;         /*该边信息指针*/

}EBox;

typedef struct VexBox{

VertexType data;

EBox  fistedge;         /*指向第一条依附该顶点的边*/

}VexBox;

typedef struct{

VexBox adjmulist［MAX_VERTEX_NUM］;

int vexnum,edgenum;     /*无向图的当前顶点数和边数*/

}AMLGraph;




图5.16无向图G1的邻接多重表


5.2图的遍历算法

图的遍历指从图中的任一顶点出发,对图中的所有顶点访问一次且只访问一次。我国有23个省份、4个直辖市、5个自治区，以及2个特别行政区。34个地区的风土人情各不相同。假如制订一份旅游计划，34个地区全部游玩一遍而且只游玩一次，这就是遍历。图的遍历操作和树的遍历操作功能相似。图的遍历是图的一种基本操作,图的许多其他操作都是建立在遍历操作的基础之上的。

由于图结构本身的复杂性,图的遍历操作也较复杂,主要表现在以下4方面。

(1) 在图结构中,没有一个“自然”的首结点,图中任意一个顶点都可作为第一个被访问的结点。

(2) 在非连通图中,从一个顶点出发,只能访问它所在的连通分量上的所有顶点,因此,还需考虑如何选取下一个出发点以访问图中其余的连通分量。

(3) 在图结构中,如果有回路存在,那么一个顶点被访问之后,有可能沿回路又回到该顶点。

(4) 在图结构中,一个顶点可以和其他多个顶点相连,当这样的顶点访问过后,存在如何选取下一个要访问的顶点的问题。

图的遍历通常有深度优先搜索和广度优先搜索两种方式,下面分别介绍。



观看视频


5.2.1深度优先搜索

深度优先搜索(Depth First Search，DFS)遍历类似于树的先根遍历,是树的先根遍历的推广。DFS算法最早是由John E.Hopcroft和他的学生Robert E.Tarjan一起提出来的，两位科学家凭借他们在数据结构与图论算法中的贡献共同获得了图灵奖。图灵奖被称为计算机领域的诺贝尔奖，获奖难度很高，但是数据结构领域的很多科学家都获得了图灵奖，因为数据结构领域的这些算法都非常的底层和经典，为后续很多算法和应用奠定了基础，甚至推动了学科领域的发展。

假设初始状态是图中的所有顶点未曾被访问,则深度优先搜索可从图中某个顶点v出发,访问此顶点,然后依次从v的未被访问的邻接点出发深度优先遍历图,直至图中所有和v有路径相通的顶点都被访问到; 若此时图中尚有顶点未被访问,则另选图中一个未曾被访问的顶点作为起始点,重复上述过程,直至图中所有顶点都被访问到为止。



图5.17一个无向图G5

以图5.17所示的无向图G5为例,进行图的深度优先搜索。假设从顶点v1出发进行搜索,在访问了顶点v1之后,选择邻接点v2。因为v2未曾访问,所以从v2出发进行搜索，以此类推,接着从v4、v8、v5出发进行搜索。在访问了v5之后,由于v5的邻接点都已被访问,因此搜索回到v8。因为同样的理由,搜索继续回到v4、v2直至v1,此时由于v1的另一个邻接点未被访问,因此搜索又从v1到v3,再继续进行下去,由此得到的顶点访问序列为

v1→v2→v4→v8→v5→v3→v6→v7

显然,这是一个递归的过程。为了在遍历过程中便于区分顶点是否已被访问,需附设访问标志数组visited［0:n1］,其初值为FALSE,一旦某个顶点被访问,则其相应的分量置为TRUE。

从图的某一点v出发,递归地进行深度优先遍历的过程如算法5.4所示。

算法5.4

void DFS(Graph G,int v)

{ /*从第v个顶点出发递归地深度优先遍历图G*/

visited［v］=TRUE;Visit(v);            /*访问第v个顶点*/

for(w=FirstAdjVex(G,v);w; w=NextAdjVex(G,v,w))

if (!visited［w］) DFS(G,w);       /*对v的尚未访问的邻接顶点w递归调用DFS算法*/

}

算法5.5和算法5.6给出了对以邻接表为存储结构的整幅图G进行深度优先遍历实现的C语言描述。

算法5.5

void DFSTraverseAL(ALGraph *G)

{/*深度优先遍历以邻接表存储的图G*/

int i;

for (i=0;i<G->n;i++)

visited［i］=FALSE;                 /*标志向量初始化*/

for (i=0;i<G->n;i++)

if (!visited［i］) DFSAL(G,i);          /*vi未访问过,从vi开始深度优先搜索*/

}/*DFSTraverseAL*/

算法5.6

void DFSAL(ALGraph *G,int i)

{/*以vi为出发点对邻接表存储的图G进行深度优先搜索*/

EdgeNode *p;

printf("visit vertex:V%c＼n",G->adjlist［i］.vertex);   /*访问顶点vi*/

visited［i］=TRUE;             /*标记vi已访问*/

p=G->adjlist［i］.firstedge;       /*取vi边表的头指针*/

while(p)                     /*依次搜索vi的邻接点vj,j=p->adjva*/

{if (!visited［p->adjvex］)        /*若vj尚未访问,则以vj为出发点向纵深搜索*/

DFSAL(G,p->adjvex);

p=p->next;                  /*找vi的下一个邻接点*/

}

}/*DFSAL*/

分析上述算法,在遍历时,对图中每个顶点至多调用一次DFS函数,因为一旦某个顶点被标记成已被访问,就不再从它出发进行搜索。因此,遍历图的过程实质上是对每个顶点查找其邻接点的过程。其耗费的时间则取决于所采用的存储结构。当用二维数组表示邻接矩阵图的存储结构时,查找每个顶点的邻接点所需时间复杂度为O(n2),其中n为图中顶点数。而当以邻接表作图的存储结构时,找邻接点所需时间复杂度为O(e),其中e为无向图中的边数或有向图中的弧数。由此,当以邻接表作存储结构时,深度优先搜索遍历图的时间复杂度为O(ne)。



观看视频


5.2.2广度优先搜索

广度优先搜索(Breadth First Search，BFS)遍历类似于树的按层次遍历的过程。BFS算法在如今看来并不复杂，但在其刚提出时被大众所接受的过程有一点曲折。它最早是康拉德教授于1945年在他的博士论文里面提出来的，但是这篇博士论文并没有第一时间被奥格斯堡大学发表，直到1972年，也就是又经过了27年，这篇论文手稿才被发表，才有了我们今天看到的BFS算法。

假设从图中某顶点v出发,在访问了v之后依次访问v的各未曾访问过的邻接点,然后分别从这些邻接点出发依次访问它们的邻接点,并使“先被访问的顶点的邻接点”先于“后被访问的顶点的邻接点”被访问,直至图中所有已被访问的顶点的邻接点都被访问到。若此时图中尚有顶点未被访问,则另选图中一个未曾被访问的顶点作起始点,重复上述过程,直至图中所有顶点都被访问到为止。换句话说,广度优先搜索遍历图的过程中以v为起始点,由近至远,依次访问和v有路径相通且路径长度为1,2,…的顶点。

例如,对图5.17所示无向图G5进行广度优先搜索遍历,首先访问v1和v1的邻接点v2和v3,然后依次访问v2的邻接点v4、v5及v3的邻接点v6和v7,最后访问v4的邻接点v8。由于这些顶点的邻接点均已被访问,并且图中所有顶点都被访问,因此完成了图的遍历。得到的顶点访问序列为

v1→v2→v3→v4→v5→v6→v7→v8

与深度优先搜索类似,在遍历的过程中也需要一个访问标志数组。并且,为了顺次访问路径长度为2,3,…的顶点,需附设队列以存储已被访问的路径长度为1,2,…的顶点。

从图的某一顶点v出发,非递归地进行广度优先遍历的过程如算法5.7所示。

算法5.7

Void BFSTraverse(Graph G, Status(*Visit)(int v))

{/*按广度优先非递归遍历图G，使用辅助队列Q和访问标志数组visited*/

for (v=0;v<G.vexnum;++v)

visited［v］=FALSE;

InitQueue(Q);                 /*初始化队列Q*/

if (!visited［v］)                 /*v尚未被访问*/

{EnQueue(Q,v);   /*v入队列*/

while (!QueueEmpty(Q)) 

{DeQueue(Q,u);           /*队头元素出队并置为u*/

visited［u］=TRUE; visit(u);   /*访问u,并设置访问标志*/

for(w=FirstAdjVex(G,u); w; w=NextAdjVex(G,u,w))

if (!visited［w］) EnQueue(Q,w);   /*u的尚未访问的邻接顶点w入队列Q*/

}

}

}/*BFSTraverse*/

算法5.8和算法5.9给出了对以邻接矩阵为存储结构的整幅图G进行广度优先遍历实现的C语言描述。

算法5.8

void BFSTraverseAL(MGraph *G)

{/*广度优先遍历以邻接矩阵存储的图G*/

int i;

for (i=0;i<G->n;i++)

visited［i］=FALSE;              /*标志向量初始化*/

for (i=0;i<G->n;i++)

if (!visited［i］) BFSM(G,i);        /*vi未访问过,从vi开始BFS搜索*/

}/*BFSTraverseAL*/

算法5.9

void BFSM(MGraph *G,int k)

{/*以vi为出发点,对邻接矩阵存储的图G进行广度优先搜索*/

int i,j;

InitQueue(&Q);

printf("visit vertex:V%c＼n",G->vexs［k］);  /*访问原点vk*/

visited［k］=TRUE;

EnQueue(&Q,k);                      /*原点vk入队列*/

while (!QueueEmpty(&Q))

{i=DeQueue(&Q);                      /*vi出队列*/

for (j=0;j<G->n;j++)                   /*依次搜索vi的邻接点vj*/

if (G->edges［i］［j］==1 && !visited［j］)/*若vj未访问*/

{printf("visit vertex:V%c＼n",G->vexs［j］);  /*访问vj*/

visited［j］=TRUE;

EnQueue(&Q,j);                         /*访问过的vj入队列*/

}

}

}/*BFSM*/

分析上述算法,每个顶点至多进一次队列。遍历图的过程实质是通过边或弧找邻接点的过程,因此广度优先搜索遍历图的时间复杂度和深度优先搜索遍历图的时间复杂度相同,两者不同之处仅仅在于对顶点访问的顺序不同。



观看视频


5.2.3深度优先搜索与广度优先搜索的应用

例5.1火力网： 炮台的排放问题,图5.18表示了一个4×4的方形城市,其中黑色块是障碍物,白色块是路(空地),黑色圆圈表示炮台安放的位置。布防规则是： 炮台可排放在路上,但任意两个炮台若中间没有障碍物分隔就不能在同一行或同一列中,反之,合法。图5.18中前两种排放合法,后两种则不合法。



图5.18城市炮台的排放


输入文件包含一幅或多幅图的描述,0表示输入结束。每幅图的描述都开始于一个整数n(n≤4),表示城市大小n×n,接下来的n行逐行描述图的信息,“.”表示开放空间,“X”表示墙。请问每次输入一幅城市图之后,最多可以排放几个炮台。［ZOJ 1002］





输入示例.X.....
4X. X....
.X...X.0
....3输出示例
XX.....5
.....XX1
2.XX5
XX42
.X....4
3....


解题思路如下。

由于地图的大小最大为4×4,可将地图用一个char数组存起来,即map［4］［4］。如果map［i］［j］'X'则表示地图此处存放的为墙,map［i］［j］'.'则表示此处存放的为空地,而map［i］［j］'o'则表示此处存放的为炮台。关键是炮台不能同时在水平和垂直线上,除非有墙作为间隔。定义k为位置,k0即为地图左上方第一个格子(见图5.19)。




0123
4567
891011
12131415


图5.19位置地图



依次往其中放炮台,需判断两个条件。

(1)   放的位置是否为空地。

(2)   同行同列不能有炮台,除非有墙间隔(见canput函数)。

如果到了kn*n，即终止条件时,看目前的最大炮台数是否大于bestn最优炮台数。

如此搜索,即可得到最好的结果。算法如下。

算法5.10

#include<stdio.h> 

int n; 	 		　　//城市的尺寸 

char map［4］［4］;  	　　//城市的地图,最多是4×4  

int bestn;  		　　//最多放的炮台数  



int canput(int row,int col)  　　//看炮台是否能够放置   

{int i;  

for(i=row-1;i>=0;i--)  		　　//扫描行

{if(map［i］［col］=='X')  

{break;   

}   

if(map［i］［col］=='o')  

{return 0;   

}  

}   

for(i=col-1;i>=0;i--)  		　　//扫描同一列

{if(map［row］［i］=='X')  

{break;   

}  

if(map［row］［i］=='o')  

{return 0;   

}  

}  

return 1;  

}  



void backtrack(int k,int current)  	　　//current为放的数目,k为放置炮台的位置0,1,2,3,…,n×n

{int x,y;  

if(k>=n*n)  				　　//到达最后一个

{if(current>bestn)  

{bestn=current;  

}  

return;  

}  

else  

{x=k/n;  		　　//计算x坐标

y=k%n;  	　　//计算y坐标

if(map［x］［y］=='.'&&canput(x,y))  

{map［x］［y］='o';  		　　//安放炮台

backtrack(k+1,current+1);  	　　//进入下一个坐标,数目加1

map［x］［y］='.';  	　　//还原

}  

backtrack(k+1,current);     

}  

}   

void initial()  

{int i,j;  

for(i=0;i<4;i++)  

{for(j=0;j<4;j++)  


{map［i］［j］='.';  

}   

}  

}  

int main()  

{scanf("%d",&n);  

while(n)  

{int i,j;  

bestn=0;   

initial();  

for(i=0;i<n;i++)  

{for(j=0;j<n;j++)  

{char ch;  

ch=getchar();  

if(ch=='＼n')  

{j--;  

continue;   

}  

else  

{map［i］［j］=ch;  

}  

}   

}    

backtrack(0,0);  	　　//不要忘了初始化

printf("%d＼n",bestn);  

scanf("%d",&n);  

}  

return 0;   

}

例5.2拼图游戏： 有一个游戏,给出一幅图,该图由n×n个小正方形组成,每个小正方形又由4个三角形组成,且每个三角形上都有一个0~9的数字,要求用这n×n个小正方形拼成一幅图,该图的每个小正方形相邻的三角形中间的数是相同的，如图5.20所示。



图5.20一个2×2的小正方形拼图前后的对比图


输入文件包含多组游戏情况,每组开始用一个整数n(0≤n≤5)表示游戏的规模,之后n×n行标识这些三角形的数字,每行包含4个数字,顺序是顶三角、右三角、底三角和左三角。0表示输入结束。输出格式见输出样例,每个游戏之间输出一个空白行。［ZOJ 1008］


输入示例

2

5 9 1 4

4 4 5 6

6 8 5 4

0 4 4 3

2

1 1 1 1

2 2 2 2

3 3 3 3

4 4 4 4

0

输出示例

Game 1: Possible


Game 2: Impossible



解题思路如下。

本题属于DFS剪枝的题目,希望读者通过本题的学习,了解经典的剪枝思想。题目输入是一个个正方形的图,通过移动方块,使得每两个方块连接处的数字相同。

为了减少搜索时间,将相同类型的方块只保存一次,并且保存相同方块出现的次数。一旦一个方块不匹配了,那么相同方块都可以直接剪枝。

由于n≤5,故用element［25］［4］,方块最多25块,每块有4个三角形,即顶三角、右三角、底三角和左三角,对应的坐标分别为0、1、2、3。用state来保存每种类型方块出现的次数。backtrack这个回溯函数,从ipos0处进行搜索,直到iposn*n,这样就到了终止条件。在每个ipos位置,分别放入各状态的方块,用完一个状态的方块,那个状态的方块个数减1; 用result记录当前放入的方块的类型,并与正上方的方块、正左方的方块进行比对,看可否放入,不能放入返回0,否则返回1。此外,方块可移动但不能旋转。

算法5.11

#include<stdio.h> 

int n;  			　　//n表示游戏的大小,n小于或等于5   

int element［25］［4］;  　　//存放每个格子  

int state［25］;  	　　//每个状态  

int result［25］;   	　　//存放的结果  

int q;   			　　//状态的个数  



void initial()  	　　//初始化  

{int i,j;  

for(i=0;i<25;i++)  

{for(j=0;j<4;j++)  

{element［i］［j］=0;  

}  

state［i］=0;   

result［i］=0;  

}   

q=0;  

}   



int backtrack(int ipos)  　　//搜索到ipos位   

{int i;  

if(ipos==n*n)    	　　//成功放完n*n个square

{return 1;  

}  

else  

{for(i=0;i<q;i++)   　　//在ipos位把每个状态放一次  

{if(state［i］==0)  //该种类型方块已经用完

{ continue; 

}   

else  

{if(ipos>=n) //判断能否符合要求： 不是最上边的

{if(element［result［ipos-n］］［2］!=element［i］［0］)  

{continue;  

}  

}   

if(ipos%n!=0) //不是最左边的

{if(element［result［ipos-1］］［1］!=element［i］［3］)  

{continue;  

}  

}  

state［i］--;   

result［ipos］=i;  

if(backtrack(ipos+1)==1)  　　//DFS的精髓

return 1;  

state［i］++;  	　　//恢复该方块的类型数1 个,便于下一次搜索

}    

}   

}  

return 0;  

}  

int main()  

{int i,j,index;  

index=0;  

int top,right,bottom,left;  

scanf("%d",&n);  

while(n)  

{initial();  

index++;  

for(i=0;i<n*n;i++) //判断是否有同一种类型,是则进行state［j］++
//同种类型加1

{scanf("%d %d %d %d",&top,&right,&bottom,&left);  

for(j=0;j<q;j++)  

{if(element［j］［0］==top&&element［j］［1］==right&&

element［j］［2］==bottom&&element［j］［3］==left)  

{state［j］++;    

break;  

}  

}  

if(j==q) //没有同种类型,将新的类型存入iSquare中

{element［q］［0］=top;  

element［q］［1］=right;  

element［q］［2］=bottom;  

element［q］［3］=left;  

state［q］=1;    //该种类型的数目现在是一种

q++;   

}  

}  

if(index>1)  

{printf("＼n");    //陷阱！就是每个结果之间要有空白行  

}   

printf("Game %d: ",index);  

if(backtrack(0))  

{printf("Possible＼n");   

}  

else  

{printf("Impossible＼n");   

}  

scanf("%d",&n);  

}  

return 0;   

}  

题目要求样例的解之间要用空行分隔,但最后一个样例的解之后就不应有多余的空行。







1359
2194
74
3526
65
7834
41
9258
8417


图5.21数独表



例5.3数独游戏： 数独游戏是一种非常流行的填数游戏。要求用1~9的数字去填充如图5.21所示的9×9表格,具体要求如下。

(1) 每行的9个格子中1~9各出现一次。

(2) 每列的9个格子中1~9各出现一次。

(3) 用粗线隔开的3×3的小块的9个格子中1~9个数字也各出现一次。

输入数据首先是给出测试用例数,然后是表相关的9行数据,每行9个十进制数字,0表示该位置是空的。对每个测试用例按照输入数据的格式输出解,并在空白处填入符合规则的数字。如果解不唯一,只要输出其中一种即可。［POJ 2676］ 





输入示例输出示例

1143628579
103000509572139468
002109400986754231
000704000391542786
300502006468917352
060000050725863914
700803004237481695
000401000619275843
009205800854396127
804000107

解题思路如下。

本题求解需要使用回溯法、DFS算法,并使用标记法剪枝。下面说说剪枝。

(1)  如果有一个格子,9个数都不能填进去,剪枝。如果只能填一个,不用说,直接填。

(2)  如果有这么一行,有一个数放到9个格子里面的任一个都不可,剪枝。如果只有一个格子可填该数,直接填。

(3)  如果有这么一列,有一个数放到9个格子里面的任一个都不可,剪枝。如果只有一个格子可填该数,直接填。

(4)  如果有这么一个九宫格,有一个数放到9个格子里面的任一个都不可,剪枝。如果只有一个格子可填该数,直接填。

参考算法如下。

算法5.12

#include<stdio.h>

#include<stdlib.h>

bool rUsed［9］［10］,cUsed［9］［10］,sUsed［9］［10］;    

//用于标记某行、某列、某个3×3小方格上哪些数字已经被使用过了  

int pos［100］;         　　//还没有填充数字的方格位置  

int nullNum;  	　　//空白的个数,即需填数字个数

int table［9］［9］;  

bool DFS_SUDO;  



void print()   		　　//输出结果表

{ for(int i=0;i<9;i++)

{ for(int j=0;j<9;j++)  

printf("%d",table［i］［j］);  

printf("＼n");  

}  

}  



void DFS(int n)

{ if (n>=nullNum)  		　　//已填写数字个数大于或等于空白数

{ DFS_SUDO=true;  	　　//递归结束

print();  			　　//调用print函数输出结果

return;  

}  

int r=pos［n］/9;              　　//在第r行  

int c=pos［n］%9;              　　//在第c列  

int k=(r/3)*3+(c/3);           　　//在第k个小方格   

for(int i=1; i<=9 && !DFS_SUDO;i++)

{ if (cUsed［c］［i］) continue;  	　　//判别列中是否用过该数字

if (rUsed［r］［i］) continue;  　　//判别行中是否用过该数字

if (sUsed［k］［i］) continue;  　　//判别方格中是否用过该数字

cUsed［c］［i］=rUsed［r］［i］=sUsed［k］［i］=true; //置已用数字标志

table［r］［c］=i;   　　//当前位置填上数字i

DFS(n+1);  	　　//递归找下一个要填数的位置

table［r］［c］=0;     //如果DFS失败就回溯,并还原原来的值  

cUsed［c］［i］=rUsed［r］［i］=sUsed［k］［i］=false;  //还原标志位的值

}   

return;  

}  



int main()

{ FILE *fp;  

int testCase;  

char line［10］;

fp=fopen("test.txt","r");     //以文件形式打开测试文件

//testCase = fgetc(fp)-'0';

fscanf(fp,"%d",&testCase);  　　//输入测试的数据组数

fgetc(fp);		　　//输入一行结束符

while(testCase--)

{ nullNum=0;  

for(int i=0;i<9;i++)                 //初始化标志位  

for(int j=0;j<10;j++)  

rUsed［i］［j］=cUsed［i］［j］=sUsed［i］［j］=false;  

for(int i=0;i<9;i++)

{ fgets(line,11,fp);               //读入一行  

for(int j=0;j<9;j++)

{ table［i］［j］=line［j］-'0';  

if(table［i］［j］){  

rUsed［i］［table［i］［j］］=true;     //第i行用过这个数  

cUsed［j］［table［i］［j］］=true;     //第j列用过这个数  

int k=(i/3)*3 + (j/3);          //第k个3×3方格  

sUsed［k］［table［i］［j］］=true;     //第k个方格用过这个数         

}  

else  

pos［nullNum++］=9*i+j;  //使用数组,记录没有填数的小方格的位置 

}  

}  

DFS_SUDO=false; 

DFS(0);  

}  

fclose(fp);

return 0;  

}

使用二维数组直接把已经存在的数字和没有填数字的位置用数组记录下来,这样在DFS时就非常方便,所以,选择合适和便于处理的数据结构有事半功倍的效果。建议读者再重新去思考和理解一下第2章中介绍的迷宫问题算法。



5.3图的连通性

利用图的遍历算法可以判定一幅图的连通性。本节将重点讨论无向图的连通性、有向图的连通性、由图得到其生成树或生成森林以及连通图中是否有关结点等几个有关图的连通性的问题。



观看视频


5.3.1无向图的连通性

在对无向图进行遍历时,对于连通图,仅需从图中任一顶点出发,进行深度优先搜索或广度优先搜索,便可访问到图中所有顶点。对于非连通图,则需从多个顶点出发进行搜索,而在每一次从一个新的起始点出发进行搜索的过程中得到的顶点访问序列恰为其各连通分量中的顶点集。例如,图5.5(a)是一幅非连通图G3,对其邻接表(见图5.22)进行深度优先搜索遍历,并调用两次深度优先搜索(即分别从顶点A和C出发),得到的顶点访问序列分别为A B F E和C D,这两个顶点集分别加上遍历时所依附于这些顶点的边,便构成了非连通图G3的两个连通分量,如图5.5(b)所示。



图5.22G3的邻接表


因此,要想判定一幅无向图是否为连通图,或有几个连通分量,就可设一个计数变量count,初始时取值为0,在算法5.5的第二个for循环中,每调用一次深度优先搜索,就给count增1。这样,当整个算法结束时,依据count的值,就可确定图的连通性了。

5.3.2有向图的连通性

深度优先搜索是求有向图的强连通分量的一个有效方法。假设以十字链表作有向图的存储结构,则求强连通分量的步骤如下。

(1) 在有向图G上,从某个顶点出发沿以该顶点为尾的弧进行深度优先搜索遍历,并按其所有邻接点的搜索都完成(即退出DFS函数)的顺序将顶点排列起来。此时需对5.2.1节中的算法进行如下两点修改： ①在进入DFSTraverseAL函数时首先进行计数变量的初始化,即在入口处加上count0的语句; ②在退出函数之前将完成搜索的顶点号记录在另一个辅助数组finished［vexnum］中,即在DFSAL函数结束之前加上finished［count］v的语句。

(2) 在有向图G上,从最后完成搜索的顶点(即finished［vexnum1］中的顶点)出发,沿着以该顶点为头的弧进行逆向的深度搜索遍历,若此次遍历不能访问到有向图中的所有顶点,则从余下的顶点中最后完成搜索的那个顶点出发,继续进行逆向的深度优先搜索遍历,以此类推,直至有向图中所有顶点都被访问到为止。此时调用DFSTraverseAL函数需进行如下修改： 函数中第二条循环语句的边界条件应改为v从finished［vexnum1］至finished［0］。

由此,每次调用DFSAL函数进行逆向深度优先遍历所访问到的顶点集便是有向图G中一个强连通分量的顶点集。

例如图5.14(a)所示的有向图,假设从顶点v1出发进行深度优先搜索遍历,得到finished数组中的顶点号为(1,3,2,0),则再从顶点v1出发进行逆向的深度优先搜索遍历,得到两个顶点集{v1,v3,v4}和{v2},这就是该有向图的两个强连通分量的顶点集。

上述求强连通分量的第(2)步,其实质如下。

(1) 构造一幅有向图Gr,设G (V,{A}),则Gr (Vr,{Ar})对于所有vi,vj∈A,必有vj,vi∈Ar。即Gr中拥有和G方向相反的弧。 

(2) 在有向图Gr上,从顶点finished［vexnum1］出发进行深度优先遍历。可以证明,在Gr上所得深度优先生成森林中每棵树的顶点集即为G的强连通分量的顶点集。

显然,利用遍历求强连通分量的时间复杂度亦和遍历相同。



观看视频


5.3.3生成树和生成森林

本节将给出通过对图的遍历,得到图的生成树或生成森林的算法。

设E(G)为连通图G中所有边的集合,则从图中任一顶点出发遍历图时,必定将E(G)分成两个集合T(G)和B(G),其中T(G)是遍历图过程中历经的边的集合; B(G)是剩余边的集合。显然,T(G)和图G中所有顶点一起构成连通图G的极小连通子图。按照5.1.2节的定义,它是连通图的一棵生成树,并且由深度优先搜索得到的为深度优先生成树; 由广度优先搜索得到的为广度优先生成树。例如,图5.23(a)和图5.23(b)所示分别为连通图G5的深度优先生成树和广度优先生成树，图中虚线为集合B(G)中的边,实线为集合T(G)中的边。



图5.23由图5.17无向图G5得到的生成树


对于非连通图,通过这样的遍历,将得到的是生成森林。例如,图5.24(b)所示为图5.24(a)的深度优先生成森林,它由3棵深度优先生成树组成。



图5.24非连通图G6及其生成森林


假设以孩子兄弟链表作生成森林的存储结构,则算法5.13生成非连通图的深度优先生成森林,其中DFSTree函数如算法5.14所示。显然,算法5.13的时间复杂度和遍历相同。

算法5.13

void DFSForest(Graph G, CSTree *T) 

{ /*建立无向图G的深度优先生成森林的孩子兄弟链表T*/

T=NULL;

for (v=0;v<G.vexnum;++v)

if (!visited［v］=FALSE;

for(v=0;v<G.vexnum;++v)

if (!visited［v］)                       /*顶点v为新的生成树的根结点*/

{ p=(CSTree)malloc(sixeof(CSNode)); /*分配根结点*/

p={GetVex(G,v).NULL,NULL};     /*给根结点赋值*/

if (!T)  

(*T)=p;                    /*T是第一棵生成树的根*/

else  q->nextsibling=p;            /*前一棵的根的兄弟是其他生成树的根*/

q=p;                            /*q指示当前生成树的根*/

DFSTree(G,v,&p);                 /*建立以p为根的生成树*/

}

}

算法 5.14

void  DFSTree(Graph G,int v,CSTree *T)

{　　/*从第v个顶点出发深度优先遍历图G,建立以*T为根的生成树*/

visited［v］=TRUE;   

first=TRUE;

for(w=FirstAdjVex(G,v);  w;  w=NextAdjVex(G,v,w))

if(!visited［w］)

{p=(CSTree)malloc(sizeof)CSNode));       /*分配孩子结点*/

*p={GetVex(G,w),NULL,NULL};

if (first)            /*w是v的第一个未被访问的邻接顶点,作为根的左孩子结点*/

{T->lchild=p;

first=FALSE;

}

else  　　/*w是v的其他未被访问的邻接顶点,作为上一邻接顶点的右兄弟*/

{q->nextsibling=p;

}

q=p;

DFSTree(G,w,&q);   /*从第w个顶点出发深度优先遍历图G,建立生成子树*q*/

}

 }



观看视频


5.3.4关节点和重连通分量

假若在删去顶点v以及和v相关联的各边之后,将图的一个连通分量分割成两个或两个以上的连通分量,则称顶点v为该图的一个关节点(Articulation Point)。一幅没有关节点的连通图称为重连通图(Biconnected Graph)。在重连通图上,任意一对顶点之间至少存在两条路径,因此在删去某个顶点以及依附于该顶点的各边时也不破坏图的连通性。若在连通图上至少删去k个顶点才能破坏图的连通性,则称此图的连通度为k。关节点和重连通图在实际中有较多应用。显然,一幅表示通信网络的图的连通度越高,其系统越可靠,无论是哪一个站点出现故障或遭到外界破坏,都不影响系统的正常工作; 又如,一个航空网若是重连通的,则当某条航线因天气等某种原因关闭时,旅客仍可从其他航线绕道而行; 再如,若将大规模的集成电路的关键线路设计成重连通图,则在某些元件失效的情况下,整个片子的功能不受影响,反之,在战争中,若要摧毁敌方的运输线,仅需破坏其运输网中的关节点即可。

例如,图5.25(a)中图G7是连通图,但不是重连通图。图中有3个关节点A、B和G。若删去顶点B以及所有依附顶点B的边,G7就被分割成3个连通分量{A、C、F、L、M、J}、{G、H、I、K}和{D、E}。类似地,若删去顶点A或G以及所依附于它们的边,则G7被分割成两个连通分量,由此,关节点亦称为割点。



图5.25无向连通图G7及其生成树


利用深度优先搜索便可求得图的关节点,并由此可判别图是否是重连通的。

图5.25(b)所示为从顶点A出发深度优先生成树,图中实线表示树边,虚线表示回边(即不在生成树上的边)。对树中任一顶点v而言,其孩子结点为在它之后搜索到的邻接点,而其双亲结点和由回边连接的祖先结点是在它之前搜索到的邻接点。由深度优先生成树可得出两类关节点的特性。

(1) 若生成树的根有两棵或两棵以上的子树,则此根顶点必为关节点。因为图中不存在连接不同子树中顶点的边,因此,若删去根顶点,生成树便变成生成森林，如图5.25(b)中所示的顶点A。

(2) 若生成树中某个非叶结点v,其某棵子树的根和子树中的其他结点均没有指向v的祖先的回边,则v为关节点。因为,若删去v,则其子树和图的其他部分被分割开来，如图5.25(b)所示的顶点B和G。

若对图Graph(V,{Edge})重新定义遍历时的访问函数visited,并引入一个新的函数low,则由一次深度优先遍历便可求得连通图中存在的所有关节点。

定义visited［v］为深度优先搜索遍历连通图时访问顶点v的次序号; 定义： 


low(v)Minvisited［v］,low［w］,visited［k］w是v在DFS生成树上的孩子结点;k是v在DFS生成树上由回边联结的祖先结点;(v,w)∈Edge;(v,k)∈Edge。

若对于某个顶点v,存在孩子结点w且low［w］≥visited［v］,则该顶点v必为关节点。因为当w是v的孩子结点时,low［w］≥visited［v］,表明w及其子孙均无指向v的祖先的回边。

由定义可知,visited［v］值即为v在深度优先生成树的前序序列的序号,只需将DFS函数中头两条语句改为visited［v0］count(在DFSTraverse中设初值count1)即可; low［v］可由后序遍历深度优先生成树求得,而v在后序序列中的次序和遍历时退出DFS函数的次序相同,由此修改深度优先搜索遍历的算法便可得到求关节点的算法(如算法5.15和算法5.16所示)。

算法 5.15

void FindArticul(ALGraph G)

{ /*连通图G以邻接表作存储结构,查找并输出G上的全部关节点*/

count=1;                         /*全局变量count用于对访问计数*/

visited［0］=1;                      /*设定邻接表上0号顶点为生成树的根*/

for(i=1;i<G.vexnum;++i)            /*其余顶点尚未访问*/

visited［i］=0;

p=G.adjlist［0］.first; 

v=p->adjvex;

DFSArticul(g,v);                   /*从顶点v出发深度优先查找关节点*/

if(count<G.vexnum)                /*生成树的根至少有两棵子树*/

{printf(0,G.adjlist［0］.vertex);         /*根是关节点,输出*/

while(p->next)

{ p=p->next; 

v=p->adjvex;

if(visited［v］==0) DFSArticul(g,v);

}

}

} /*FindArticul*/

算法 5.16

void DFSArticul(ALGraph G,int v0)

/*从顶点v0出发深度优先遍历图G,查找并输出关节点*/

{ visited［v0］min=++count;                  /*v0是第count个访问的顶点*/

for(p=G.adjlist［v0］.firstedge; p; p=p->next;)   /*对v0的每个邻接点检查*/

{ w=p->adjvex;                        /*w为v0的邻接点*/

if(visited［w］==0)                      /*若w未曾访问,则w为v0的孩子*/

{ DFSArticul(G,w);                  /*返回前求得low［w］*/

if(low［w］<min)min=low［w］;

if(low［w］>=visited［v0］) printf(v0,G.adjlist［v0］.vertex);  /*输出关节点*/

} 

else if(visited［w］<min) min=visited［w］;  /*w已访问,w是v0在生成树上的祖先*/

}

low［v0］=min;

}

例如,图G7中各顶点计算所得visited和low的函数值如表5.1所示。


表5.1visited与low的函数值表


i0123456789101112


G. adjlist［i］.vertexABCDEFGHIJKLM
visited［i］15121011138694723
low［i］1115515582511
求得low值的顺序13987612352141110


表5.1中J是第一个求得low值的顶点,由于存在回边(J,L),因此low［J］Min{visited［J］,visited［L］}2。顺便提一句,上述算法中将指向双亲的树边也看成回边,由于不影响关节点的判别,因此,为使算法简明,在算法中没有区别之。

由于上述算法的过程就是一个遍历的过程,因此,求关节点的时间复杂度仍为O(ne)。



观看视频


5.3.5有向图的强连通分量

求强连通分量有3种算法——Kosaraju、Tarjan、Gabow。本节重点介绍高效的Tarjan算法。Tarjan算法的应用非常广泛,几乎任何和图的遍历有关的问题都可以套用Tarjan算法的思想(如求割点、桥、块、强连通分量等)。提出此算法的普林斯顿大学的Robert E.Tarjan教授也是1986年的图灵奖获得者。

在有向图G中,如果两个顶点间至少存在一条路径,称两个顶点强连通(Strongly Connected)。如果有向图G的每两个顶点都强连通,称G是一幅强连通图。非强连通图有向图的极大强连通子图,称为强连通分量(Strongly Connected Component,SCC)。求强连通分量的意义是： 由于强连通分量内部的结点性质相同,因此可以将一个强连通分量内的结点缩成一个点,即消除了环,这样,原图就变成了一幅有向无环图(Directed Acyclic Graph,DAG)。

图5.26中G8的子图{1,2,3,4}为一个强连通分量,因为顶点1、2、3、4两两可达。{5}、{6}也分别是两个强连通分量。

直接根据定义,用双向遍历取交集的方法求强连通分量,时间复杂度为O(N2M)。更好的方法是Tarjan算法或Kosaraju算法,两者的时间复杂度都是O(NM)。



图5.26有向图G8

Tarjan算法是基于对图深度优先搜索的算法,每个强连通分量为搜索树中的一棵子树。搜索时,把当前搜索树中未处理的结点加入一个堆栈,回溯时可以判断栈顶到栈中的结点是否为一个强连通分量。

定义DFN(u)为结点u搜索的次序编号(时间戳),Low(u)为u或u的子树能够追溯到的最早的栈中结点的次序号。由定义可以得出： 

Low(u)=Min

{DFN(u),

Low(v),(u,v)为树枝边,u为v的双亲结点

DFN(v),(u,v)为指向栈中结点的后向边(非横叉边)

}

当DFN(u)=Low(u)时,以u为根的搜索子树上所有结点是一个强连通分量。伪代码如下。

算法 5.17

tarjan(u)

{DFN［u］=Low［u］=++Index          	　　//为结点u设定次序编号和Low初值

Stack.push(u)                         //将结点u压入栈中

for each (u, v) in E                     //枚举每条边

if (v is not visted)               　　//如果结点v未被访问过

tarjan(v)                  　　//继续向下找

Low［u］ = min(Low［u］, Low［v］)

else if (v in S)                   　　//如果结点v还在栈内

Low［u］ = min(Low［u］, DFN［v］)

if (DFN［u］ == Low［u］)                 　　//如果结点u是强连通分量的根

repeat

v = S.pop                  　　//将v退栈,为该强连通分量中一个顶点

print v

until (u== v)

}


算法演示:从结点1开始进行深度优先搜索,把遍历到的结点加入栈中。搜索到结点u6时,DFN［6］Low［6］,找到一个强连通分量。退栈到uv为止,{6}为一个强连通分量(见图5.27(a))。



图5.27针对图5.25有向图G8的Tarjan算法演示


返回结点5,发现DFN［5］Low［5］,退栈后{5}为一个强连通分量(见图5.27(b))。

返回结点3,继续搜索到结点4,把4加入堆栈。发现结点4向结点1有后向边,结点1还在栈中,所以Low［4］1。结点6已经出栈,(4,6)是横叉边,返回3,(3,4)为树枝边,所以Low［3］Low［4］1(见图5.26(c))。

继续回到结点1,最后访问结点2。访问边(2,4),4还在栈中,所以Low［2］DFN［4］5。返回1后,发现DFN［1］Low［1］,把栈中结点全部取出,组成一个连通分量{1,3,4,2}(见图5.27(d))。

至此,算法结束。通过该算法求出了图中全部的3个强连通分量，分别为{1,3,4,2}、{5}、{6}。运行Tarjan算法的过程中,每个顶点都被访问了一次,且只进出了一次堆栈,每条边也只被访问了一次,所以该算法的时间复杂度为O(NM)。算法模板如下。

算法 5.18

int top;			　　//用作栈顶的指针

int Stack［MAX］;	　　//维护的一个栈

bool instack［MAX］;　　//instack［i］为真表示i在栈中 

int DFN［MAX］,Low［MAX］;

int Belong［MAX］;	　　//Belong［i］ = a; 表示i这个点属于第a个连通分量

int Bcnt,Dindex;	　　//Bcnt用来记录连通分量的个数,Dindex表示到达某个点的时间

void tarjan(int u)

{int v;

DFN［u］=Low［u］ = ++ Dindex;	　　//这里要注意 Dindex是初始化为0,这里就不能
//Dindex++; 不然第一个点的DFN和Low就为0

Stack［++ top］ = u;

instack［u］ = true;

for (edge *e = V［u］; e; e = e->next)	　　//对所有可达边进行搜索

{v = e->t;

if (!DFN［v］)					　　//用来更新Low［u］

{tarjan(v);

if (Low［v］<Low［u］)

Low［u］ = Low［v］;

}

else if (instack［v］ && DFN［v］<Low［u］)

Low［u］ = DFN［v］;

}

if (DFN［u］ == Low［u］)				　　//已找完一个强连通

{Bcnt ++;						　　//强连通个数加1

do

{v = Stack［top --］;

instack［v］ = false;

Belong［v］ = Bcnt;

}

while (u != v);					　　//一直到v=u都属于第Bcnt个强连通分量

}

}

void solve()

{int i;

Stop = Bcnt = Dindex = 0;

memset(DFN,0,sizeof(DFN));

for (i = 1; i<= N; i ++)	　　//一定要对所有点应用Tarjan算法才能求出所有
//点的强连通分量

if (!DFN［i］)

tarjan(i);

}

该Tarjan算法与求无向图的双连通分量(割点、桥)的Tarjan算法有着很深的联系。学习该Tarjan算法,有助于深入理解求双连通分量的Tarjan算法,两者可以类比、组合理解。



观看视频


例5.4道路建设(Road Construction)。题目描述： 给你一幅无向图,然后问你至少需要添加几条边,可以使整幅图变成边双连通分量,也就是说任意两点至少有两条路可以互相连通。

第一行输入两个整数n、r，n(3≤n≤1000)表示岛上的旅游景点数,r(2≤r≤1000)是道路数,旅游景点被标识为1~n。接着的r行是表示景点的两个整数v和w。游客可以沿着道路的任何一个方向旅行,每对景点之间至多一条直接的道路。在当前道路设置中,任何的两个景点间都可以旅行。输出需要添加的最少道路数。［POJ 3352］


输入示例1

10 12

1 2

1 3

1 4

2 5

2 6


5 6

3 7

3 8

7 8

4 9

4 10

9 10
输入示例2

3 3

1 2

2 3

1 3
输出示例1

2
输出示例2

0



问题分析如下。

对于属于同一个边双连通分量的任意点至少有两条通路是可以互相可达的,因此可以将一个边双连通分量缩成一个点。考虑不在边双连通分量中的点,通过缩点后可形成一棵树。对于一幅树形的无向图,需要添加(度为1的点的个数1)/2条边使得图成为双连通的。这样问题就变成缩点之后求图中度为1的点的个数了。

这个题目的条件给得很强,任意两个点之间不会有重边,因此可以直接经过Tarjan算法的low值进行边双连通分量的划分,最后求出度为1的点数即可。如果有重边,则不同的low值是可能属于同一个边双连通分量的,这时就要通过将图中的桥去掉然后求解边双连通分量。

Tarjan算法在求解强连通分量时,通过引入深度优先搜索过程中对一个点访问的顺序dfsNum(也就是在访问该点之前已经访问的点的个数)和一个点可以到达的最小的dfsNum的low数组,当遇到一个顶点的dfsNum值等于low值时,那么该点就是一个强连通分量的根。因为在深度优先搜索的过程中已经将点入栈,因此只需要将栈中的元素出栈直到遇到根,那么这些点就组成一个强连通分量。

对于边双连通分量,还需要先了解一些概念。

(1) 边连通度： 使一幅子图不连通所需要删除的最小的边数就是该图的边连通度。

(2) 桥(割边)： 当删除一条边就使得图不连通的那条边称为桥或者是割边。

(3) 边双连通分量： 边连通度大于或等于2的子图称为边双连通分量。

理解了这些概念之后再来看看Tarjan算法是如何求解边双连通分量的,不过在此之前还得先说说Tarjan算法是怎样求桥的。

引入dfsNum表示一个点在深度优先搜索过程中所被访问的时间,然后就是low数组表示该点最小的可以到达的dfsNum。分析一下桥的特点,删除一条边之后,如果深度优先搜索过程中的子树没有任何一个点可以到达双亲结点及双亲结点以上的结点,那么这个时候子树就被封死了,这条边就是桥。有了这个性质,也就是说当深度优先搜索过程中遇到一条树边a→b,并且此时low［b］dfsNum［a］,那么a→b就是一座桥。把所有的桥去掉之后那些独立的分量就是不同的边双连通分量,此时就可以按照需要灵活地求出边双连通分量了。参考代码如下。

算法 5.19

#include<iostream> 

#include<cstring> 

#include<cstdlib> 

#include<cstdio> 

#include<vector> 

using namespace std;  

const int Max=1010;  

int top［Max］,edge［Max］［Max］;　　//memset(top,0,sizeof(top));  

int dfsNum［Max］,dfsnum;　　//memset(dfsNum,0,sizeof(dfsNum)),dfsNum=1;  

int low［Max］,degree［Max］, cc［Max］;

int ccCnt, ans;    

bool exist［Max］［Max］;  

void tarjan(int a,int fa)  

{dfsNum［a］=low［a］=++dfsnum;  

for(int i=0;i<top［a］;i++)  

{if(edge［a］［i］!=fa)  

{if(dfsNum［edge［a］［i］］==0)  

{tarjan(edge［a］［i］,a);  

if(low［a］>low［edge［a］［i］］)  

low［a］=low［edge［a］［i］］;  

if(dfsNum［a］<low［edge［a］［i］］)  

exist［a］［edge［a］［i］］ = exist［edge［a］［i］］［a］ = true;  

}  

else  

if(low［a］>dfsNum［edge［a］［i］］)  

low［a］=dfsNum［edge［a］［i］］;  

}  

}  

}  



void dfs(int fa, int u)  

{cc［u］ = ccCnt;  

for(int i=0; i<top［u］; i++)  

{   int v = edge［u］［i］;  

if(v != fa && !exist［u］［v］ && !cc［v］)  

dfs(u, v);  

}  

}  



int solve(int n)  

{int i,j;  

int a,b;  

memset(cc, 0, sizeof(cc));  

ccCnt = 1;  

for(i=1; i<=n; i++)  

{if(!cc［i］)  

{dfs(-1, i);  

ccCnt++;  

}  

}  

for(i=1;i<=n;i++)  

{a=i;  

for(j=0;j<top［i］;j++)  

{b=edge［a］［j］;  

if(cc［a］ != cc［b］)  

{degree［cc［a］］++;  

degree［cc［b］］++;  

}  

}  

}  

int leaves=0;  

for(i=1;i<ccCnt;i++)  

if(degree［i］==2)  

leaves++;  

return (leaves+1)/2;  

}  



int main()  

{int n,m;  

int i,a,b;  

while(scanf("%d %d",&n,&m)!=EOF)  

{memset(top,0,sizeof(top));  

memset(degree,0,sizeof(degree));  

for(i=0;i<m;i++)  

{scanf("%d %d",&a,&b);  

edge［a］［top［a］++］=b;  

edge［b］［top［b］++］=a;  

}  

memset(dfsNum,0,sizeof(dfsNum));  

dfsnum=0;  

memset(exist, false, sizeof(exist));  

tarjan(1,-1);  

ans=solve(n);  

printf("%d＼n",ans);  

}  

return 0;  

}

Robert Tarjan还发明了求双连通分量的Tarjan算法,以及求最近公共祖先的离线Tarjan算法,建议基础好的读者去设计实现这些算法［POJ 1236,1470］。




观看视频



5.4有向无环图及其应用

5.4.1有向无环图的概念

一幅无环的有向图称作有向无环图(Directed Acycline Graph，DAG)。DAG是一类较有向树更一般的特殊有向图,图5.28给出了有向树、有向无环图和有向图的例子。



图5.28有向树、有向无环图和有向图示意


有向无环图是描述含有公共子式的表达式的有效工具。例如下述表达式： 

((ab)*(b*(cd) (cd)*e)*((cd)*e)

可以用第6章讨论的二叉树来表示,如图5.29所示。仔细观察该表达式,可发现有一些相同的子表达式,如(cd)和(cd)*e等,在二叉树中,它们也重复出现。若利用有向无环图,则可实现对相同子式的共享,从而节省存储空间。例如，图5.30所示为表示同一表达式的有向无环图。




图5.29用二叉树描述表达式




图5.30描述表达式的有向无环图




检查一幅有向图是否存在环要比无向图复杂。对于无向图来说,若在深度优先搜索遍历过程中遇到回边(即指向已访问过的顶点的边),则必定存在环; 而对于有向图来说,这条回边有可能是指向深度优先生成森林中另一棵生成树上顶点的弧。但是,如果从有向图上某个顶点v出发的遍历,在dfs(v)结束之前出现一条从顶点u到顶点v的回边,由于u在生成树上是v的子孙,因此有向图必定存在包含顶点v和u的环。

有向无环图是描述一项工程或系统的进行过程的有效工具。除最简单的情况之外,几乎所有的工程(Project)都可分为若干称作活动(Activity)的子工程,而这些子工程之间通常受着一定条件的约束,如其中某些子工程的开始必须在另一些子工程完成之后。对整个工程和系统,人们关心的是两方面的问题： 一是工程能否顺利进行： 二是估算整个工程完成所必需的最短时间。5.4.2节和5.4.3节将详细介绍这样两个问题是如何通过对有向图进行拓扑排序和关键路径操作来解决的。



观看视频


5.4.2AOV网与拓扑排序
1. AOV(Activity On Vertex)网

一个工程或某种流程可以分解为若干小工程或阶段,这些小工程或阶段就称为活动。若以图中的顶点来表示活动,有向边表示活动之间的优先关系,则这样的活动在顶点上的有向图称为AOV网。在AOV网中,若从顶点i到顶点j之间存在一条有向路径,称顶点i是顶点j的前驱,或者称顶点j是顶点i的后继。若i,j是图中的弧,则称顶点i是顶点j的直接前驱,顶点j是顶点i的直接后驱。

AOV网中的弧表示了活动之间存在的制约关系。例如,计算机专业的学生必须完成一系列规定的基础课和专业课才能毕业。学生按照怎样的顺序来学习这些课程呢？这个问题可以被看作一个大的工程,其活动就是学习每一门课程。这些课程的名称与相应代号如表5.2所示。


表5.2计算机专业的课程设置及其关系


课程代号课程名先行课程代号课程代号课程名先行课程代号


C1程序设计导论无C8算法分析C3
C2数值分析C1,C13C9高级语言C3,C4
C3数据结构C1,C13C10编译系统C9
C4汇编语言C12C11操作系统C10
C5自动机理论C13C12解析几何无
C6人工智能C3C13微积分C12
C7机器原理C13


表中,C1、C12是独立于其他课程的基础课,而有的课却需要有先行课程,例如,学完程序设计导论和数值分析后才能学数据结构等,先行条件规定了课程之间的优先关系。这种优先关系可以用图5.31所示的有向图来表示。其中,顶点表示课程,有向边表示前提条件。若课程i为课程j的先行课,则必然存在有向边i,j。在安排学习顺序时,必须保证在学习某门课之前已经学习了其先行课程。



图5.31一个AOV网实例


类似的AOV网的例子还有很多,如大家熟悉的计算机程序,任何一个可执行程序也可以划分为若干程序段(或若干语句),由这些程序段组成的流程图也是一个AOV网。

2. 拓扑排序

首先介绍一下离散数学中的偏序集合与全序集合两个概念。

若集合A中的二元关系R是自反的、非对称的和传递的,则R是A上的偏序关系。集合A与关系R一起称为一个偏序集合。

若R是集合A上的一个偏序关系,如果对每个a,b∈A必有aRb或bRa,则R是A上的全序关系。集合A与关系R一起称为一个全序集合。

偏序关系经常出现在日常生活中。例如,若把A看成一项大的工程必须完成的一批活动,则aRb意味着活动a必须在活动b之前完成。例如,对于前面提到的计算机专业的学生必修的基础课与专业课,由于课程之间的先后依赖关系,某些课程必须在其他课程以前讲授,这里的aRb就意味着课程a必须在课程b之前学完。

AOV网所代表的一项工程中活动的集合显然是一个偏序集合。为了保证该项工程得以顺利完成,必须保证AOV网中不出现回路; 否则,意味着某项活动应以自身作为能否开展的先决条件,这是不合理的。

测试AOV网是否具有回路(即是否是一幅有向无环图)的方法,就是在AOV网的偏序集合下构造一个线性序列,该线性序列具有以下性质。

(1) 在AOV网中,若顶点i优先于顶点j,则在线性序列中顶点i仍然优先于顶点j。

(2) 对于网中原来没有优先关系的顶点i与顶点j,如图5.31中所示的C1与C13,在线性序列中也建立了一个先后关系,或者顶点i优先于顶点j,或者顶点j优先于顶点i。

满足这样性质的线性序列称为拓扑有序序列。构造拓扑序列的过程称为拓扑排序。也可以说拓扑排序就是由某个集合上的一个偏序得到该集合上的一个全序的操作。

若某个AOV网中所有顶点都在它的拓扑序列中,则说明该AOV网不会存在回路,这时的拓扑序列集合是AOV网中所有活动的一个全序集合。以图5.31中的AOV网为例,可以得到不止一个拓扑序列,C1、C12、C4、C13、C5、C2、C3、C9、C7、C10、C11、C6、C8就是其中之一。显然,对于任何一项工程中各活动的安排,必须按拓扑有序序列中的顺序进行才是可行的。

3. 拓扑排序算法

对AOV网进行拓扑排序的方法和步骤如下。

(1) 从AOV网中选择一个没有前驱的顶点(该顶点的入度为0)并且输出它。

(2) 从网中删去该顶点,并且删去从该顶点发出的全部有向边。

(3) 重复上述两步,直到剩余的网中不再存在没有前驱的顶点为止。

这样操作的结果有两种： 一种是网中全部顶点都被输出,这说明网中不存在有向回路; 另一种就是网中顶点未被全部输出,剩余的顶点均有前驱顶点,这说明网中存在有向回路。

图5.32给出了在一个AOV网上实施上述步骤的例子。



图5.32求一拓扑序列的过程


这样得到一个拓扑序列： V2,V5,V1,V4,V3,V7,V6。

为了实现上述算法,对AOV网采用邻接表存储方式,并且在邻接表中的顶点结点中增加一个记录顶点入度的数据域,即顶点结构设为count,vertex, firstedge。
其中,vertex、firstedge的含义如前所述; count为记录顶点入度的数据域。边结点的结构同5.2.2节所述。图5.32(a)中的AOV网的邻接表如图5.33所示。



图5.33图5.32(a)所示的AOV网的邻接表


顶点表结点结构的描述改为

typedef struct vnode{            /*顶点表结点*/

int   count                  /*存放顶点入度*/

VertexType vertex;          /*顶点域*/

EdgeNode  * firstedge;      /*边表头指针*/

}VertexNode;       

当然也可以不增设入度域,而另外设一个一维数组来存放每个结点的入度。

算法中可设置一个堆栈,凡是网中入度为0的顶点都将其入栈。为此,拓扑排序的算法步骤如下。

(1) 将没有前驱的顶点(count域为0)压入栈。

(2) 从栈中退出栈顶元素输出,并把该顶点引出的所有有向边删去,即把它的各邻接顶点的入度减1。

(3) 将新的入度为0的顶点再入堆栈。

(4) 重复步骤(2)~(4),直到栈为空为止。此时或者是已经输出全部顶点,或者剩下的顶点中没有入度为0的顶点。

从上面的步骤可以看出,栈在这里只是起到一个保存当前入度为零的顶点,并使之处理有序的作用。这种有序可以是后进先出,也可以是先进先出,故此也可用队列来辅助实现。在下面给出用C语言描述的拓扑排序的算法实现中,采用栈来存放当前未处理过的入度为0的结点,但并不需要额外增设栈的空间,而是设一个栈顶位置的指针将当前所有未处理过的入度为0的结点联结起来,形成一个链式栈。

算法5.20

void Topo_Sort(AlGraph *G)

{/*对以代入度的邻接链表为存储结构的图G,输出其一种拓扑序列*/

int  top = -1;                  /*栈顶指针初始化*/

for (i=0; i<n; i++)               /*依次将入度为0的顶点压入链式栈*/

{if (G->adjlist［i］.count == 0)

{G->adjlist［i］.count = top; 

top = i; 

}

}

for (i=0;i<n;i++)

{if (top=-1)

{printf("The network has a cycle");

return;

}

j=top;

top=G->adjlist［top］.count;      /*从栈中退出一个顶点并输出*/

printf("% c",G->adjlist［j］.vertex);

ptr=G->adjlist［j］.firstedge;

while (ptr!=null)

{k=ptr->adjvex;

G->adjlist［k］.count--;       /*当前输出顶点邻接点的入度减1*/

if(G->adjlist［k］.count==0)  /*新的入度为0的顶点进栈*/

{G->adjlist［k］.count=top;

top=k; 

}

ptr=ptr->next;             /*找到下一个邻接点*/

}

}

}

对一个具有n个顶点、e条边的网来说,整个算法的时间复杂度为O(en)。



观看视频


5.4.3AOE网与关键路径
1. AOE(Activity On Edge)网

若在带权的有向图中,以顶点表示事件,以有向边表示活动,边上的权值表示活动的开销(如该活动持续的时间),则此带权的有向图称为AOE网。

如果用AOE网来表示一项工程,那么,仅仅考虑各子工程之间的优先关系还不够,更多的是关心整个工程完成的最短时间是多少; 哪些活动的延期将会影响整个工程的进度,而加速这些活动是否会提高整个工程的效率。因此,通常在AOE网中列出完成预定工程计划所需要进行的活动,每个活动计划完成的时间,要发生哪些事件以及这些事件与活动之间的关系,从而可以确定该项工程是否可行,估算工程完成的时间以及确定哪些活动是影响工程进度的关键。

AOE网具有以下两个性质。

(1) 只有在某顶点所代表的事件发生后,从该顶点出发的各有向边所代表的活动才能开始。

(2) 只有在进入一某顶点的各有向边所代表的活动都已经结束时,该顶点所代表的事件才能发生。

图5.34给出了一个具有15个活动、11个事件的假想工程的AOE网。v1,v2,…,v11分别表示一个事件; v1,v2,v1,v3,…,v10,v11分别表示一个活动; 用a1,a2,…,a15代表这些活动。其中,v1称为源点,是整个工程的开始点,其入度为0; v11为终点,是整个工程的结束点,其出度为0。



图5.34一个AOE网实例


对于AOE网,可采用与AOV网一样的邻接表存储方式。其中,邻接表中边结点的域为该边的权值,即该有向边代表的活动所持续的时间。

2. 关键路径

由于AOE网中的某些活动能够同时进行,因此完成整个工程所必须花费的时间应该为源点到终点的最大路径长度(这里的路径长度指该路径上的各活动所需时间之和)。具有最大路径长度的路径称为关键路径。关键路径上的活动称为关键活动。关键路径长度是整个工程所需的最短工期。这就是说,要缩短整个工期,必须加快关键活动的进度。

利用AOE网进行工程管理时需要解决的主要问题如下。

(1) 计算完成整个工程的最短路径。

(2) 确定关键路径,以找出哪些活动是影响工程进度的关键。

3. 关键路径的确定

为了在AOE网中找出关键路径,需要定义几个参量,并且说明其计算方法。

1) 事件的最早发生时间ve［k］ 

ve［k］指从源点到顶点的最大路径长度代表的时间。这个时间决定了所有从顶点发出的有向边所代表的活动能够开工的最早时间。根据AOE网的性质,只有进入vk所有活动vj,vk都结束时,vk代表的事件才能发生; 而活动vj,vk的最早结束时间为ve［j］dut(vj,vk)。所以计算vk发生的最早时间的方法如下： 

ve［l］0
ve［k］Max{ve［j］dut(vj,vk)}，vj,vk∈p［k］(5.1)

其中,p［k］表示所有到达vk的有向边的集合; dut(vj,vk)为有向边vj,vk上的权值。



观看视频


2) 事件的最迟发生时间vl［k］

vl［k］指在不推迟整个工期的前提下,事件vk允许的最晚发生时间。设有向边vk,vj代表从vk出发的活动,为了不拖延整个工期,vk发生的最迟时间必须保证不推迟从事件vk出发的所有活动vk,vj的终点vj的最迟时间vl［j］。vl［k］的计算方法如下： 

vl［n］ve［n］
vl［k］Min{vl［j］dut(vk,vj)}，vk,vj∈s［k］(5.2)

其中,s［k］为所有从vk发出的有向边的集合。

3) 活动ai的最早开始时间e［i］

若活动ai由弧vk,vj表示,根据AOE网的性质,只有事件vk发生了,活动ai才能开始。也就是说,活动ai的最早开始时间应等于事件vk的最早发生时间。因此,有

e［i］ve［k］(5.3)

4) 活动ai的最晚开始时间l［i］

活动ai的最晚开始时间指在不推迟整个工程完成日期的前提下,必须开始的最晚时间。若由弧vk,vj表示,则ai的最晚开始时间要保证事件vj的最迟发生时间不拖后。因此,应该有

l［i］vl［j］dut(vk,vj)(5.4)

根据每个活动的最早开始时间e［i］和最晚开始时间l［i］就可判定该活动是否为关键活动,也就是那些l［i］e［i］的活动就是关键活动,而那些l［i］e［i］的活动则不是关键活动,l［i］e［i］的值为活动的时间余量。关键活动确定之后,关键活动所在的路径就是关键路径。

以图5.35所示的AOE网为例,求出上述参量,确定该网的关键活动和关键路径。

首先,按照式(5.1)求事件的最早发生时间ve［k］。





ve(1)0ve(7)max{ve(4)6,ve(5)8}15
ve(2)3ve(8)ve(5)411
ve(3)4ve(9)max{ve(8)10,ve(6)2}21
ve(4)ve(2)25ve(10)max{ve(8)4,ve(9)1}22
ve(5)max{ve(2)1,ve(3)3}7ve(11)max{ve(7)7,ve(10)6}28
ve(6)ve(3)59

其次,按照式(5.2)求事件的最迟发生时间vl［k］。





vl(11) ve(11)28vl(5)min{vl(7)8,vl(8)4}7
vl(10) vl(11)622vl(4) vl(7)615
vl(9)vl(10)121vl(3)min{vl(5)3, vl(6)5}4
vl(8)min{vl(10)4, vl(9)10}11vl(2)min{vl(4)2,vl(5)1}6
vl(7)vl(11)721vl(1)min{vl(2)3, vl(3)4}0
vl(6) vl(9)219

再按照式(5.3)和式(5.4)求活动ai的最早开始时间e［i］和最晚开始时间l［i］。





a1e(1)ve(1)0l(1)vl(2) 3 3
a2e(2)ve(1)0l(2)vl(3)  40
a3e(3)ve(2)3l(3)vl(4)  213
a4e(4)ve(2)3l(4)vl(5)  16
a5e(5)ve(3)4l(5)vl(5)  34
a6e(6)ve(3)4l(6)vl(6)  514
a7e(7)ve(4)5l(7)vl(7)  615
a8e(8)ve(5)7l(8)vl(7)  813
a9e(9)ve(5)7l(9)vl(8)  47
a10e(10)ve(6)9l(10)vl(9)  219
a11e(11)ve(7)15l(11)vl(11)  721
a12e(12)ve(8)11l(12)vl(10)  418
a13e(13)ve(8)11l(13)vl(9)  1011
a14e(14)ve(9)21l(14)vl(10) 121
a15e(15)ve(10)22l(15)vl(11) 6 22

最后,比较e［i］和l［i］的值可判断出a2,a5,a9,a13,a14,a15是关键活动,关键路径如图5.35所示。


图5.35一个AOE网实例



由上述方法得到求关键路径的算法步骤如下。

(1) 输入e条弧j,k,建立AOE网的存储结构。

(2) 从源点v0出发,令ve［0］0,按拓扑有序求其余各顶点的最早发生时间ve［i］(1≤i≤n1)。如果得到的拓扑有序序列中顶点个数小于网中顶点数n,则说明网中存在环,不能求关键路径,算法终止; 否则执行步骤(3)。

(3) 从汇点vn出发,令vl［n1］ve［n1］,按逆拓扑有序求其余各顶点的最迟发生时间vl［i］(n2≥i≥2)。

(4) 根据各顶点的ve和vl值,求每条弧s的最早开始时间e(s)和最迟开始时间l(s)。若某条弧满足条件e(s)l(s),则为关键活动。

由该步骤得到的算法如算法5.21和算法5.22所示。在算法5.21中,Stack为栈的存储类型; 引用的函数FindInDegree(G,indegree)用来求图G中各顶点的入度,并将所求的入度存放于一维数组indegree中。

算法5.21

int topologicalOrder(ALGraph G,Stack T) 

 { /*有向网G采用邻接表存储结构,求各顶点事件的最早发生时间ve(全局变量)*/

/*T为拓扑序列顶点栈,S为零入度顶点栈*/

/*若G无回路,则用栈T返回G的一个拓扑序列,且函数值为OK,否则为ERROR*/

FindInDegree(G, indegree);                  /*对各顶点求入度indegree［0..vernum-1］*/

InitStack(S);                              /*建立入度顶点栈S*/

count = 0;  ve［0..G.vexnum-1］ = 0;           /*初始化ve［ ］*/

for (i=0; i<G.vexnum; i++)                  /*将初始时入度为0的顶点入栈*/

{if (indegree［i］==0)  push(S,i); }

while (!StackEmpty(S)) {

Pop(S,j);  Push(T,j);  ++ count;     /*j号顶点入T栈并计数*/

for (ｐ=Ｇ.adjlist［j］.firstedge; p; p=p->next) 

{k = p->adjvex;                         /*对j号顶点的每个邻接点的入度减1*/

if(-- indegree［k］ == 0)  Push(S,k);  /*若入度减为0, 则入栈*/

if (ve［j］+* (p->info)>ve［k］)   

ve［k］ = ve［j］+*(p->info); 

} 

} 

if (count<G. vexnum)  return 0;              /*该有向网有回路返回0,否则返回1*/

else return 1; 

} /*TopologicalOrder*/

算法5.22

int Criticalpath(ALGraph G) 

{ /*G为有向网,输出G的各项关键活动*/

InitStack(T);                                /*建立用于产生拓扑逆序的栈T*/

if (!TopologicalOrder(G,T))   return 0;        /*该有向网有回路返回0*/

vl［0..G.vexnum-1］ = ve ［G.vexnum-1］;            /*初始化顶点事件的最迟发生时间*/

while (!StackEmpty(T))                     /*按拓扑逆序求各顶点的vl值*/

for (Pop(T,j), p=G.adjlist［j］.firstedge; p; p=p->next) 

{k=p->adjvex;  dut = * (p->info);   

if (vl［k］-dut<vl［j］)  vl［j］ = vl［k］ – dut;

} 

for (j=0; j<G.vexnum; ++j)                    /*求e、l和关键活动*/

for (p=G.adjlist［j］.firstedge; p; p = p->next) 

{k = p->adjvex;   dut= * (p->indo);

e = ve［j］; l = vl［k］ - dut;

tag = (e==l) ? '*':'' ;

printf(j,k,dut,e,l,tag);                 /*输出关键活动*/

}

return 1;                                    /*求出关键活动后返回1*/

} /*Criticalpath*/



观看视频



5.5最短路径算法

最短路径问题是图的又一个比较典型的应用问题。例如,某一地区的一个公路网,给定了该网内的n个城市以及这些城市之间的相通公路的距离,能否找到城市A到城市B之间一条距离最近的通路呢？如果将城市用点表示,城市间的公路用边表示,公路的长度作为边的权值,那么,这个问题就可归结为在网图中,求点A到点B的所有路径中,边的权值之和最短的那一条路径。这条路径就是两点之间的最短路径,并称路径上的第一个顶点为源点(Sourse),最后一个顶点为终点(Destination)。在非网图中,最短路径指两点之间经历的边数最少的路径。

输入一幅赋权图： 与每条边(vi,vj)相联系的是穿越该弧的代价(或称为值)ci,j,一条路径v1,v2,…,vn,的值是∑n1i1ci,i1,叫作赋权路径长度(Weighted Path Length)。而无权路径长度(Unweighted Path Length)只是路径上的边数,即n1。

单源最短路径问题： 给定一幅带权图G  (V, E)和一个特定顶点s作为输入,找到s到G中每个其他顶点的最短带权路径。

例如图5.36(a)中,从v1到v6的最短带权路径长度为6,它是从v1到v4到v7再到v6的路径。这两个顶点间的最短无权路径长度为2。图5.36(b)给出了一条权值为负数的边,从v5到v4的路径长度为1,但通过循环v5,v4,v2,v5,v4存在一条最短路径,其值为5,其实这条路径仍然不是最短的,因为循环可以进行多次,因此,这两个顶点间的最短路径问题是不确定的。类似地，v1到v6的最短路径也是不确定的,因为它可以进入同样的循环，这个循环叫负值环(Negative Cost Cycle); 当它出现在图中时,最短路径问题就是不确定的。有带负值的边未必就是坏事,但它的出现似乎使问题增加了难度。



图5.36带权有向图和带负值权的有向图


本节重点介绍单源最短路径问题的相关算法。首先,考虑无权最短路径问题,并指出如何以O(|E||V|)时间解决它。其次,假设边无负值,如何求解带权最短路径问题,期望在使用合理数据结构实现时的运行时间为O(|E|·log2|V|)。如果图有负边,介绍一个时间界为O(|E|·|V|)的简单解法。

5.5.1无权最短路径

显然无权图可以视为权值都为1的带权图的特殊情形,如可将图5.36（a）视为一幅权值均为1的无权图G。使用某个顶点s作为输入参数,要找出从s到所有其他顶点的最短路径。假设选择s为v3,则s到v3的最短路径为0,下一步可以通过v3找到路径长度为1的顶点v1和v6,再通过v1和v6找出路径长度为2的顶点v2和v4,最后通过v2、v4找出其余顶点的路径长度均为3。显然,这个方法就是BFS,处理过程类似于树的层次遍历,其时间复杂度为O(|E||V|)。下面简要说明算法的实现。

对于每个顶点,关注顶点是否被处理(未处理为F,处理过为T,初始为F),s到此顶点的路径长dv(s初始为0,其他为INFINITY)。在任意时刻,只存在两种类型的未知顶点,一些顶点的dvcurrDist,另一些顶点的dvcurrDist1。一种抽象是保留两个盒子,1号盒子装有dv  currDist的那些未知顶点,而2号盒子装有dv  currDist 1的那些顶点。找出一个合适顶点的测试可以用查找1号盒内的任意顶点v代替。在更新v的临界顶点w后,将w放入2号盒中。

可以使用一个队列进一步简化上述模型。迭代开始时,队列只含有距离为currDist的顶点。当添加距离为currDist1的那些邻接顶点时,由于它们自队尾入队,因此保证它们直到所有距离为currDist的顶点都被处理之后才处理。下面给出无权最短路径问题的伪代码。

算法5.23

void unweighted(Vertex s)

{Queue<Vertex>q = new Queue<Vertex>();  //一个队列  

for each Vertex v   　　//每个顶点初始距离为INFINITY  

v.dist = INFINITY;  

s.dist = 0;  	　　//s初始距离为0     

q.enqueue(s);  

while(!q.isEmpty())

{Vertex v = q.dequeue();  

for each Vertex w adjacent to v  	　　//遍历v的邻接顶点

if(w.dist == INFINITY) 　　//如果dist是INFINITY说明没有处理过

{w.dist = v.dist + 1;  

w.path = v;  

q.enqueue(w);  

}  

}  

}



观看视频


5.5.2Dijkstra算法

Dijkstra算法是由迪杰斯特拉(Dijkstra)提出的一个按路径长度递增的次序产生最短路径的算法。这个算法是迪杰斯特拉教授在他26岁陪未婚妻逛街时想出来的，数学家在逛街疲惫休息时想出了如何提高逛街效率的方法，查找逛街的最短路径。对于权值全为正的图，Dijkstra算法是解决单源最短路径的常用算法。凭借这一算法，迪杰斯特拉教授获得了图灵奖。

1. Dijkstra算法的思想

设G (V,E)是一幅带权有向图(无向可以转换为双向有向),设置两个顶点的集合S和TVS,集合S中存放已找到最短路径的顶点,集合T存放当前还未找到最短路径的顶点。初始状态时,集合S中只包含源点v0,然后不断从集合T中选取到顶点v0路径长度最短的顶点u加入集合S中,集合S每加入一个新的顶点u,都要修改顶点v0到集合T中剩余顶点的最短路径长度值,集合T中各顶点新的最短路径长度值为原来的最短路径长度值与顶点u的最短路径长度值加上u到该顶点的路径长度值中的较小值。不断重复此过程,直到集合T的顶点全部加入S中为止。

Dijkstra算法的正确性可以用反证法加以证明。假设下一条最短路径的终点为x,那么,该路径必然或者是弧(v0,x),或者是中间只经过集合S中的顶点而到达顶点x的路径。因为假若此路径上除x之外有一个或一个以上的顶点不在集合S中,那么必然存在另外的终点不在S中而路径长度比此路径还短的路径,这与按路径长度递增的顺序产生最短路径的前提相矛盾,所以此假设不成立。



观看视频


2. Dijkstra算法的具体步骤

(1) 初始时,S只包含源点,即S{v},v的距离dist［v］为0。T包含除v外的其他顶点,T中顶点u距离dist［u］为边上的权值(有边<v,u)或为∞(没有边<v,u)。

(2) 从T中选取一个距离v(dist［k］)最小的顶点k,把k加入S中(该选定的距离就是v到k的最短路径长度)。

(3) 以k为新考虑的中间点,修改T中各顶点的距离; 若从源点v到顶点u(u∈T)的距离(经过顶点k)比原来距离(不经过顶点k)短,则修改顶点u的距离值,修改后的距离值为顶点k的距离加上边上的权(即如果dist［k］w［k,u］dist［u］,那么把dist［u］更新成更短的距离dist［k］w［k,u］)。

(4) 重复步骤(2)和(3)，直到所有顶点都包含在S中(要循环n1次)。

由此求得从v到图上其余各顶点的最短路径是依路径长度递增的序列。

3. Dijkstra算法的实现

Dijkstra算法最简单的实现方法就是,在每次循环中,再用一个循环找距离最短的点,然后用任意的方法更新与其相邻的边,时间复杂度显然为O(n2)。

对于空间复杂度，如果只要求出距离,只要n的附加空间保存距离就可以了(距离小于当前距离的是已访问的结点,对于距离相等的情况可以比较编号或是特殊处理一下)。如果要求出路径则需要另外V的空间保存前一个结点,共需要2n的空间。

首先,引进一个辅助向量D,它的每个分量D［i］表示当前所找到的从始点v到每个终点vi的最短路径的长度。其次,假设用带权的邻接矩阵edges来表示带权有向图,edges［i］［j］表示弧vi,vj上的权值。若vi,vj不存在,则置edges［i］［j］为∞。

算法5.24用C语言描述的Dijkstra算法

void Dijkstra(Mgraph G,int v0,PathMatrix *p, ShortPathTable *D)

{ /*用Dijkstra算法求有向网G的v0顶点到其余各顶点v的最短路径P［v］及其路径长度D［v］*/

/*若P［v］［w］为TRUE,则w是从v0到 v当前求得最短路径上的顶点*/

/*final［v］为TRUE当且仅当v∈S,即已经求得从v0到v的最短路径*/

/*常量INFINITY为边上权值可能的最大值*/

for (v=0;v<G.vexnum;++v)

{fianl［v］=FALSE; D［v］=G.edges［v0］［v］;

for (w=0; w<G.vexnum; ++w)  P［v］［w］=FALSE;  /*设空路径*/

if (D［v］<INFINITY) {P［v］［v0］=TRUE; P［v］［w］=TRUE;}

}

D［v0］=0; final［v0］=TRUE; /*初始化,v0顶点属于S集*/

/*开始主循环,每次求得v0到某个v 顶点的最短路径,并加v到S集*/

for(i=1; i<G.vexnum; ++i)  /*其余G.vexnum-1个顶点*/

{min=INFINITY;   /*min为当前所知离v0顶点的最近距离*/

for (w=0;w<G.vexnum;++w)

if (!final［w］)/*w顶点在VS中*/

if (D［w］<min) {v=w; min=D［w］;}

final［v］=TRUE   /*离v0顶点最近的v加入S集合*/

for(w=0;w>G.vexnum;++w)  /*更新当前最短路径*/

if (!final［w］&&(min+G.edges［v］［w］<D［w］)) /*修改D［w］和P［w］,w∈V-S*/

{D［w］=min+G.edges［v］［w］; 

P［w］=P［v］; P［w］［v］=TRUE;  /*P［w］=P［v］+P［w］*/

}

}

}/*Dijkstra*/

4. Dijkstra算法过程演示

例如,图5.37(a)所示有向网图G9的带权邻接矩阵如图5.37(b)所示。



图5.37有向网图G9及其邻接矩阵



若对G9施行Dijkstra算法,则所得从v0到其余各顶点的最短路径,以及运算过程中D向量的变化状况如表5.3所示。


表5.3用Dijkstra算法构造单源点最短路径过程中各参数的变化示意


终点
从v0到各终点的D值和最短路径的求解过程

i1i2i3i4i5


v1∞∞∞∞∞
v210 (v0,v2)
v3∞60(v0,v2,v3)50 (v0,v4,v3)
v430 (v0,v4)30 (v0,v4)
v5100(v0,v5)100 (v0,v5)90 (v0,v4,v5)60 (v0,v4,v3,v5)
vjv2v4v3v5
S{v0,v2}{v0,v2,v4}{v0,v2,v3,v4}{v0,v2,v3,v4,v5}

下面分析一下这个算法的运行时间。第一个for循环的时间复杂度是O(n),第二个for循环共进行n1次,每次执行的时间是O(n)。所以总的时间复杂度是O(n2)。如果用带权的邻接表作为有向图的存储结构,则虽然修改D的时间可以减少,但由于在D向量中选择最小分量的时间不变,所以总的时间复杂度仍为O(n2)。

如果只希望找到从源点到某一个特定的终点的最短路径,从上面求最短路径的原理来看,这个问题和求源点到其他所有顶点的最短路径一样复杂,其时间复杂度也是O(n2)。

5. Dijkstra算法实战练习

例5.5直到奶牛回家(Till the Cows Come Home)。问题： 共有N个结点和T条边组成的无向图,现在求源点N到结点1(Home)的最短路径(2≤N≤1000,1≤T≤2000)。

输入第一行是两个整数T和N,第二行至第T1行,每行三个用空格分开的整数,分别表示顶点对和权值,即(Vi,Vj,W)。输出回家(N~1)的最短距离。［POJ 2387］


输入示例

5 5

1 2 20

2 3 30

3 4 20

4 5 20

1 5 100

输出示例

90


解题思路如下。

本题属于简单的模板题。但用Dijkstra算法找最短路要注意此题为无向图,所以需要考虑可能会存在重复的边,用邻接矩阵表示时有a［i］［j］ a［j］［i］。

算法5.25

#include<iostream> 

using namespace std;  

#define inf 1<<29  

#define MAXV 1005  

int map［MAXV］［MAXV］;  

int n,m;  



void dijkstra(){  

int i,j,min,v;  

int d［MAXV］;  

bool vis［MAXV］;  

for(i=1;i<=n;i++){  

vis［i］=0;  

d［i］=map［1］［i］;  

}  

for(i=1;i<=n;i++){  

min=inf;  

for(j=1;j<=n;j++)  

if(!vis［j］ && d［j］<min){  

v=j;  

min=d［j］;  

}  

vis［v］=1;  

for(j=1;j<=n;j++)  

if(!vis［j］ && d［j］>map［v］［j］+d［v］)  

d［j］=map［v］［j］+d［v］;  

}  

printf("%d＼n",d［n］);  

}  



int main(){  

int i,j,a,b,c;  

while(~scanf("%d%d",&m,&n)){  

for(i=1;i<=n;i++)  

for(j=1;j<=n;j++)  

if(i==j)  

map［i］［i］=0;  

else map［i］［j］=map［j］［i］=inf;  



for(i=1;i<=m;i++){  

scanf("%d%d%d",&a,&b,&c);  

if(map［a］［b］>c) map［a］［b］=map［b］［a］=c;  

}  

dijkstra();  

}  

return 0;  

}

Dijkstra算法的核心是以起始点为中心向外层层扩展,直到扩展到终点为止。对于单源最短路径问题,一般有以下两种经典解法。

（1) 对于有权值为负的图,采用BellmanFord算法。

（2) 对于权值全为正的图,常采用Dijkstra算法。

BellmanFord算法将在5.5.3节介绍。




观看视频


5.5.3具有负值边的图

如果图具有负值边,那么Dijkstra算法是行不通的。问题在于一旦一个顶点u被声明是已知的,就可能从某个另外的未知顶点v有一条回到u的负的路径。

一个诱人的解决方案是将一个常数Δ加到每条边上,从而除去负值边,再计算新图的最短路径,然后把结果用到原来的图上。这种方案不可能直接实现,因为那些须有许多条边的路径变得比那些具有很少边的路径权重更重了。另一个思路是把带权和无权的算法结合起来将会解决这个问题,但是要付出运行时间激烈增长的代价。下面主要介绍一个常用的能解决该问题的BellmanFord算法。

BellmanFord算法是由美国数学家理查德·贝尔曼(Richard Bellman,动态规划的提出者)和小莱斯特·福特(Lester Ford)发明的。

1. BellmanFord算法思想

BellmanFord算法能在更普遍的情况下(存在负权边)解决单源点最短路径问题。对于给定的带权(有向或无向)图G (V,E),其源点为s,加权函数w是边集E的映射。对图G运行BellmanFord算法的结果是一个布尔值,表明图中是否存在着一个从源点s可达的负权回路。若不存在这样的回路,算法将给出从源点s到图G的任意顶点v的最短路径Distant［v］,否则无解。

2. BellmanFord算法流程

(1) 初始化： 数组Distant［i］记录从源点s到顶点i的路径长度，初始化数组Distant［i］，源点s的Distant［s］为0，除源点外其他顶点i的Distant［i］为∞。

(2) 迭代求解： 反复对边集E中的每条边进行松弛操作,使得顶点集V中的每个顶点v的最短距离估计值逐步逼近其最短距离(运行|v|1次),即对于每条边e(u,v),如果Distant［u］w(u,v)  Distant［v］,则令Distant［v］  Distant［u］w(u, v)。w(u, v)为边e(u,v)的权值。

若上述操作没有对Distant进行更新,说明最短路径已经查找完毕,或者部分点不可达,跳出循环; 否则执行下次循环。

(3) 检验负权回路： 判断边集E中的每条边的两个端点是否收敛,即对于每条边e(u, v),如果存在Distant［u］  w(u, v)  Distant［v］的边,且权值之和小于0,则图中存在负环路,该图无法求出单源最短路径。如果存在不收敛的顶点,则算法返回false,表明问题无解; 否则算法返回true,并且从源点可达的顶点v的最短距离保存在Distant［v］中。

算法描述如下。

Bellman-Ford(G,w,s)： boolean   //图G,边集函数w,s为源点

for each vertex v ∈ V(G) do       　　//初始化,1阶段

d［v］ ←+∞

d［s］ ←0;                       　　//1阶段结束

for i=1 to |v|-1 do               　　//2阶段开始,双重循环

for each edge(u,v)∈E(G) do 　　//边集数组要用到,穷举每条边

If d［v］>d［u］+ w(u,v) then   //松弛判断

d［v］=d［u］+w(u,v)     　　//松弛操作,2阶段结束

for each edge(u,v)∈E(G) do

If d［v］>d［u］+ w(u,v) then

return false

return true

BellmanFord算法寻找单源最短路径的时间复杂度为O(V·E)。

3. BellmanFord算法描述性证明

首先,图的任意一条最短路径既不能包含负权回路,也不会包含正权回路,因此它最多包含|v|1条边。

其次,从源点s可达的所有顶点如果存在最短路径,则这些最短路径构成一个以s为根的最短路径树。BellmanFord算法的迭代松弛操作,实际上就是按顶点距离s的层次,逐层生成这棵最短路径树的过程。

在对每条边进行第1遍松弛时,生成了从s出发,层次至多为1的那些树枝。也就是说,找到了与s至多有1条边相连的那些顶点的最短路径; 在对每条边进行第2遍松弛时,生成了第2层次的树枝,就是说找到了经过2条边相连的那些顶点的最短路径……因为最短路径最多只包含|v|1条边,所以,只需要循环|v|1次。

每实施一次松弛操作,最短路径树上就会有一层顶点达到其最短距离,此后这层顶点的最短距离值就会一直保持不变,不再受后续松弛操作的影响。

如果没有负权回路,由于最短路径树的高度最多只能是|v|1,因此最多经过|v|1遍松弛操作后,所有从s可达的顶点必将求出最短距离。如果d［v］仍保持∞,则表明从s到v不可达。如果有负权回路,第|v|1遍松弛操作仍会成功,但负权回路上的顶点不会收敛。

4. BellmanFord算法过程演示

BellmanFord算法是最简单的算法,就是从开始结点开始循环每一条边,对它进行松弛操作,最后得到的路径就是最短路径。执行过程如图5.38所示。



图5.38BellmanFord算法的执行过程


在图5.38中,源点是顶点s。d值被标记在顶点内,阴影覆盖的边指示了前驱值。图5.38(a)示出了对边进行第一趟操作前的情况。图5.38(b)~图5.38(e)示出了每一趟连续对边操作后的情况。图5.38(e)中d的值是最终结果。BellmanFord算法在本例中返回的是True。

5. BellmanFord算法参考代码

算法5.26

#include<iostream> 

#include<cstdio> 

using namespace std;  

#define MAX 0x3f3f3f3f  

#define N 1010  

int nodenum, edgenum, original;	 //点、边、起点  

typedef struct Edge 	　　//边  

{int u, v;  

int cost;  

}Edge;  

Edge edge［N］;  

int dis［N］, pre［N］;  

bool Bellman_Ford()  

{for(int i = 1; i<= nodenum; ++i) 	　　//初始化  

dis［i］ = (i == original ? 0 : MAX);  

for(int i = 1; i<= nodenum - 1; ++i)  

for(int j = 1; j<= edgenum; ++j)  

if(dis［edge［j］.v］>dis［edge［j］.u］ + edge［j］.cost)//松弛(顺序一定不能反)  

{dis［edge［j］.v］ = dis［edge［j］.u］ + edge［j］.cost;  

pre［edge［j］.v］ = edge［j］.u;  

}  

bool flag = 1; 	　　//判断是否含有负权回路  

for(int i = 1; i<= edgenum; ++i)  

if(dis［edge［i］.v］>dis［edge［i］.u］ + edge［i］.cost)  

{flag = 0;  

break;  

}  

return flag;  

}  



void print_path(int root) 	　　//打印最短路的路径(反向)  

{while(root != pre［root］)	　　//前驱  

{printf("%d-->", root);  

root = pre［root］;  

}  

if(root == pre［root］)  

printf("%d＼n", root);  

}  



int main()  

{scanf("%d%d%d", &nodenum, &edgenum, &original);  

pre［original］ = original;  

for(int i = 1; i<= edgenum; ++i)  

{scanf("%d%d%d", &edge［i］.u, &edge［i］.v, &edge［i］.cost);  

}  

if(Bellman_Ford())  

for(int i = 1; i<= nodenum; ++i) 	　　//每个点的最短路  

{   printf("%d＼n", dis［i］);  

printf("Path:");  

print_path(i);  

}  

else  

printf("have negative circle＼n");  

return 0;  

}  

建议读者利用BellmanFord算法重解例5.5。



观看视频


5.5.4所有点对的最短路径

Dijkstra算法是求单源最短路径的,如果求图中所有点对的最短路径，则有以下两种解法。

(1) 以图中的每个顶点作为源点,分别调用Dijkstra算法,时间复杂度为O(n3)。

(2)  Floyd算法更简洁,但算法时间复杂度仍为O(n3)。

本节主要介绍Floyd提出的一个算法。

Floyd算法是另一种经典的最短路径算法,不同的是Dijkstra算法仅计算了从一个起点出发的最短路径,而Floyd算法可以计算全部结点到其他结点的最短路径。Floyd算法的基本思想也是松弛。这是一个动态规划的经典例子,在求解各点到其他点的最短路径的过程中往往会有很多的重叠问题,通过表D［］［］将这些问题保存下来,避免了重复的计算。

1. Floyd算法基本思想

Floyd算法仍从图的带权邻接矩阵cost出发,假设求从顶点vi到vj的最短路径。如果从vi到vj有弧,则从vi到vj存在一条长度为edges［i］［j］的路径,该路径不一定是最短路径,尚需进行n次试探。首先考虑路径(vi,v0,vj)是否存在(即判别弧(vi,v0)和(v0,vj)是否存在)。如果存在,则比较(vi,vj)和(vi,v0,vj)的路径长度，取长度较短者为从vi到vj的中间顶点的序号不大于0的最短路径。假如在路径上再增加一个顶点v1,也就是说,如果(vi,…,v1)和(v1,…,vj)分别是当前找到的中间顶点的序号不大于1的最短路径,那么(vi,…,v1,…,vj)就有可能是从vi到vj的中间顶点序号不大于1的最短路径。将它和已经得到的从vi到vj中间顶点序号不大于0的最短路径相比较,从中选出中间顶点序号不大于1的最短路径,再增加一个顶点v2,继续进行试探，以此类推。在一般情况下,若(vi,…,vk)和(vk,…,vj)分别是从vi到vk和从vk到vj的中间顶点的序号不大于k的最短路径,则将(vi,…,vk,…,vj)和已经得到的从vi到vj且中间顶点序号不大于k1的最短路径相比较,其长度较短者便是从vi到vj的中间顶点的序号不大于k的最短路径。这样,在经过n次比较后,最后求得的必是从vi到vj的最短路径。按此方法,可以同时求得各对顶点间的最短路径。

2. Floyd算法的基本步骤

现定义一个n阶方阵序列： D(1),D(0),D(1),…,D(k),D(n1)。

初始化：  D(1)cost,D(1)［i］［j］edges［i］［j］,表示初始的从i到j的中间不经过其他中间点的最短路径。

迭代： 设D(k1)已求出,如何得到D(k)(0≤k≤n1)是该算法的关键,也是该算法中动态规划的主要思想,由Floyd算法基本思想可得： 

D(k)［i］［j］Min{D(k1)［i］［j］, D(k1)［i］［k］D(k1)［k］［j］}，0≤k≤n1

从上述计算公式可见,D(1)［i］［j］是从vi到vj的中间顶点的序号不大于1的最短路径的长度; D(k)［i］［j］是从vi到vj的中间顶点的个数不大于k的最短路径的长度; D(n1)［i］［j］就是从vi到vj的最短路径的长度。

3. Floyd算法实现

由上述动态规划方程可知,可以用3个for循环来实现Floyd算法,需要注意的是for循环的嵌套顺序： 

for(int k=0; k<n; k++)

for(int i=0; i<n; i++)

for(int j=0; j<n; j++)

如果嵌套的顺序是习惯上的i、j、k,而不是现在的k、i、j,则所得的结果就会出现问题。

为了保存最短路径所行经的路径,这里要用到另一个矩阵P,它的定义是： P［i］［j］的值如果为p,就表示i到j的最短行经为i→…p→j,即p是i到j的最短行径中j之前的最后一个顶点。P矩阵的初值为P［i］［j］i。因此,采用逆序的方法即可输出实际的行径。

当D［i］［j］D［i］［k］D［k］［j］时,就把P［k］［j］存入P［i］［j］。

由此得到求任意两顶点间的最短路径的算法。

算法5.27

void Floyd(Mgraph G, PathMatrix *P［］,DistancMatrix *D)

{ /*用Floyd算法求有向网G中各对顶点v和w之间的最短路径P［v］［w］及其带权长度D［v］［w］*/

/*若P［v］［w］［u］为TRUE,则u是从v到w当前求得的最短路径上的顶点*/

for(v=0;v<G.vexnum;++v)              /*各对顶点之间初始已知路径及距离*/

for(w=0;w<G,vexnum;++w)

{ D［v］［w］=G.arcs［v］［w］;

for(u=0;u<G,vexnum;++u)  P［v］［w］［u］=FALSE;

if (D［v］［w］<INFINITY)            /*从v到w有直接路径*/

{ P［v］［w］［v］=TRUE;

}

}

for(u=0; u<G.vexnum; ++u)

for(v=0; v<G.vexnum; ++v)

for(w=0;w<G.vexnum;++w)

if (D［v］［u］+D［u］［w］<D［v］［w］)     /*从v经u到w的一条路径更短*/

{D［v］［w］=D［v］［u］+D［u］［w］;

for(i=0;i<G.vexnum;++i)

P［v］［w］［i］=P［v］［u］［i］||P［u］［w］［i］;

}

}/*Floyd*/

4. Floyd算法过程演示

图5.39给出了一个简单的有向网及其邻接矩阵。图5.40给出了用Floyd算法求该有向网中每对顶点之间的最短路径过程中,数组D和数组P的变化情况。



图5.39有向网图G9及其邻接矩阵




D(-1)04116023∞0
D(0)0411602370
D(1)046602370
D(2)046502370

P(-1)abacbabcca
P(0)abacbabccacab
P(1)ababcbabccacab
P(2)ababcbcabccacab


图5.40Floyd算法执行时数组D和数组P取值的变化示意


5. Floyd算法实战练习

例5.6股票经纪小道消息(Stockbroker Grapevine): 股票经纪人要在一群人中散布一个传言,传言只能在认识的人中传递,题目将给出人与人的关系(是否认识),以及传言在某两个认识的人中传递所需的时间,要求程序给出以哪个人为起点,可以在耗时最短的情况下,让所有人收到消息。

输入首行是股票经纪人数n,接下来每一行表示某个经纪人的联系信息(联系数,联系人,传递耗时),没有特殊的标点符号或间距规则。股票经纪人数按1~100编号,传递信息耗时1~10分钟,联系数为0~n1,n为0时输入结束。输出股票经纪人最快的传输时间(保留整数)。

如果图中某个点是不可达的,则输出disjoint,如果A、B间可互传信息,则A到B的传输时间不一定等于B到A传输时间。［POJ 1125］

解题思路如下。

题目是要求从某一结点开始,能让消耗的总时间最短。实际上这是一个在有向图中求最短路径问题,先求出每个人向其他人发信息所用的最短时间(当然不是每个人都能向所有人发信息),然后在所有能向每个人发信息的人中比较他们所用最大时间,找出所用最大时间最少的那一个即为所求。


输入示例

2 2 4 3 5

2 1 2 3 6

2 1 2 2 2

5

3 4 4 2 8 5 3

1 5 8

4 1 6 4 10 2 7 5 2

3
0

2 2 5 1 5

0

输出示例

3 2

3 10

参考代码如下。

算法5.28

#include<iostream> 

#include<string> 

#include<cstring> 

#include<algorithm> 

#include<cstdio> 

using namespace std;  

const int maxn=1000;  

const int inf=10000000;  

int map［maxn］［maxn］;  

void floyd(int n){  

for(int k=1;k<=n;++k)  

for(int i=1;i<=n;++i)  

for(int j=1;j<=n;++j)  

map［i］［j］=min(map［i］［j］,map［i］［k］+map［k］［j］);  

}  

int main(){  

int n;  

while(~scanf("%d",&n),n){  

for(int i=1;i<=n;++i){  

for(int j=1;j<=n;++j)  

if(i==j) map［i］［j］=0;  

else map［i］［j］=inf;   //初始化  

int m; scanf("%d",&m);  

while(m--){  

int x,c; scanf("%d%d",&x,&c);  

if(c<map［i］［x］) map［i］［x］=c;  

}  

}  

floyd(n);  

int ans=inf,mj=-1;  

for(int i=1;i<=n;++i){  

int maxt=0;  

for(int j=1;j<=n;++j)  

maxt=max(maxt,map［i］［j］);  

if(maxt<ans) ans=maxt,mj=i;  

}  

if(mj==-1) puts("disjoint");  

else printf("%d %d＼n",mj,ans);  

}  

return 0;  

}  


比较Dijkstra和Floyd算法,不难得出以下的结论： 对于稀疏图,采用n次Dijkstra比较出色； 对于稠密图,可以使用Floyd算法； 此外,Floyd算法还可以处理带负边的图。



观看视频



5.6最小支撑树

由生成树的定义可知,无向连通图的生成树不是唯一的。连通图的一次遍历所经过的边的集合及图中所有顶点的集合就构成了该图的一棵生成树,对连通图的不同遍历,就可能得到不同的生成树。图5.41(a)~图5.41(c)所示均为图5.17所示的无向连通图G5的生成树。



图5.41无向连通图G5的3棵生成树


可以证明,对于有n个顶点的无向连通图,无论其生成树的形态如何,所有生成树中都有且仅有n1条边。如果无向连通图是一个网,那么它的所有生成树中必有一棵边的权值总和最小的生成树,称这棵生成树为最小生成树。

最小生成树的概念可以应用到许多实际问题中，如铁路进藏工程，如何以最低成本在世界屋脊修建“幸福天路”，此外，最小生成树算法在城市规划、电网、通信等领域都有广泛应用。例如以尽可能低的总造价建造城市间的通信网络,把10个城市联系在一起。在这10个城市中,任意两个城市之间都可以建造通信线路,通信线路的造价依据城市间的距离不同而有不同的造价,可以构造一个通信线路造价网络,在网络中,每个顶点表示城市,顶点之间的边表示城市之间可构造通信线路,每条边的权值表示该条通信线路的造价,要想使总的造价最低,实际上就是寻找该网络的最小生成树。

下面介绍两种常用的构造最小生成树的方法。

5.6.1Prim算法

假设G(V,E)为一网图,其中V为网图中所有顶点的集合,E为网图中所有带权边的集合。设置两个新的集合U和T,其中集合U用于存放G的最小生成树中的顶点,集合T存放G的最小生成树中的边。令集合U的初值为U{u1}(假设构造最小生成树时,从顶点u1出发),集合T的初值为T{}。Prim算法的思想是： 从所有u∈U,v∈V-U的边中,选取具有最小权值的边(u,v),将顶点v加入集合U中,将边(u,v)加入集合T中,如此不断重复,直到UV时,最小生成树构造完毕,这时集合T中包含了最小生成树的所有边。

Prim算法可用下述过程描述,其中用wuv表示顶点u与顶点v边上的权值。

(1) U{u},T{};

(2) while (UV)do

(u,v)min{wuv; u∈U,v∈VU}

TT{(u,v)}

UU{v}; 

(3) 结束。

如图5.42(a)所示网图,按照Prim方法,从顶点V1出发,该网的最小生成树的产生过程如图5.42(b)~图5.42(g)所示。



图5.42Prim算法构造最小生成树的过程示意


为实现Prim算法,需设置两个辅助一维数组： lowcost和closevertex。其中，lowcost用来保存集合V-U中各顶点与集合U中各顶点构成的边中具有最小权值的边的权值; 数组closevertex用来保存依附于该边的在集合U中的顶点。假设初始状态时,U{u1}(u1为出发的顶点),这时有lowcost［0］0,它表示顶点u1已加入集合U中,数组lowcost的其他各分量的值是顶点u1到其余各顶点所构成的直接边的权值。然后不断选取权值最小的边(ui,uk)(ui∈U,uk∈V-U),每选取一条边,就将lowcost(k)置为0,表示顶点uk已加入集合U中。由于顶点uk从集合V-U进入集合U后,这两个集合的内容发生了变化,因此需依据具体情况更新数组lowcost和closevertex中部分分量的内容。最后closevertex中即为所建立的最小生成树。

当无向网采用二维数组存储的邻接矩阵存储时,Prim算法的C语言实现如下。

算法5.29

void Prim(int gm［］［MAXNODE］,int n,int closevertex［］)

{ /*用Prim方法建立有n个顶点的邻接矩阵存储结构的网图gm的最小生成树*/

 /*从序号为0的顶点出发; 建立的最小生成树存于数组closevertex中*/

int lowcost［100］,mincost;

int i,j,k;

for (i=1;i<n;i++)           /*初始化*/

{lowcost［i］=gm［0］［i］;

closevertex［i］=0;

}

lowcost［0］=0;              /*从序号为0的顶点出发生成最小生成树*/

closevertex［0］=0;

for (i=1;i<n;i++)            /*寻找当前最小权值的边的顶点*/

{mincost=MAXCOST;     /*MAXCOST为一个极大的常量值*/

j=1;k=1;

while (j<n)

{if (lowcost［j］<mincost && lowcost［j］!=0)

{mincost=lowcost［j］;

k=j;

}

j++;

}

printf("顶点的序号=%d边的权值=%d＼n",k,mincost);

lowcost［k］=0;

for (j=1;j<n;j++)          /*修改其他顶点的边的权值和最小生成树顶点序号*/

if (gm［k］［j］<lowcost［j］)

{lowcost［j］=gm［k］［j］;

closevertex［j］=k;

}

}

}

表5.4给出了在用上述算法构造网图5.42 (a)的最小生成树的过程中,数组closevertex、lowcost及集合U、V-U的变化情况,读者可进一步加深对Prim算法的了解。

在Prim算法中,第一个for循环的执行次数为n1,第二个for循环中又包括了一个while循环和一个for循环,执行次数为2(n1)2,所以Prim算法的时间复杂度为O(n2)。


表5.4用Prim算法构造最小生成树过程中各参数的变化示意



顶点
(1) (2) (3) (4) (5) (6) (7) 
lowcost

closevertexlowcost

closevertexlowcost

closevertexlowcost

closevertexlowcost

closevertexlowcost

closevertexlowcost

closevertex



v101010101010101
v2501010101010101
v360160160152452445707
v4∞165250505050505
v5∞14020202020202
v6∞1∞1705304040404
v7∞1∞1∞14244240404

U{v1}{v1,v2}{v1,v2,v5}{v1,v2,v5,
v4}{v1,v2,v5,
v4,v6}{v1,v2,v5,
v4,v6,v7}{v1,v2,v5,
v4,v6,v7,
v3}
T{}{(v1,v2)}{(v1,v2),(v2,v5)}{(v1,v2),(v2,v5),(v4,v5)}{(v1,v2),(v2,v5),(v4,v5),(v4,v6)}{(v1,v2),(v2,v5),(v4,v5),(v4,v6),(v4,v7)}{(v1,v2),(v2,v5),(v4,v5),(v4,v6),(v4,v7),(v3,v7)}




观看视频


5.6.2Kruskal算法

Kruskal算法是一种按照网中边的权值递增的顺序构造最小生成树的方法。其基本思想是： 设无向连通网为G(V,E),令G的最小生成树为T,其初态为T(V,{}),即开始时,最小生成树T由图G中的n个顶点构成,顶点之间没有一条边,这样T中各顶点各自构成一个连通分量。然后,按照边的权值由小到大的顺序,考察G的边集E中的各条边。若被考察的边的两个顶点属于T的两个不同的连通分量,则将此边作为最小生成树的边加入T中,同时把两个连通分量连接为一个连通分量; 若被考察边的两个顶点属于同一个连通分量,则舍去此边,以免造成回路,如此下去,当T中的连通分量个数为1时,此连通分量便为G的一棵最小生成树。

对于图5.42(a)所示的网,按照Kruskal方法构造最小生成树的过程如图5.43所示。在构造过程中,按照网中边的权值由小到大的顺序,不断选取当前未被选取的边集中权值最小的边。依据生成树的概念,n个结点的生成树有n1条边,故重复上述过程,直到选取了n1条边为止,就构成了一棵最小生成树。



图5.43Kruskal算法构造最小生成树的过程示意


下面介绍Kruskal算法的实现。

设置一个结构数组edges存储网中所有的边,边的结构类型包括构成的顶点信息和边权值,定义如下。

#define MAXEDGE <图中的最大边数>

typedef struct {

elemtype v1;

elemtype v2;

int cost;

} EdgeType;

EdgeType edges［MAXEDGE］;

在结构数组edges中,每个分量edges［i］代表网中的一条边,其中edges［i］.v1和edges［i］.v2表示该边的两个顶点,edges［i］.cost表示这条边的权值。为了方便选取当前权值最小的边,事先把数组edges中的各元素按照其cost域值由小到大的顺序排列。在对连通分量合并时,采用集合的合并方法。对于有n个顶点的网,设置一个数组father［n］,其初值为father［i］1(i0,1,…,n1),表示各顶点在不同的连通分量上,然后,依次取出edges数组中的每条边的两个顶点,查找它们所属的连通分量,假设vf1和vf2为两顶点所在的树的根结点在father数组中的序号,若vf1不等于vf2,表明这条边的两个顶点不属于同一分量,则将这条边作为最小生成树的边输出,并合并它们所属的两个连通分量。

下面用C语言实现Kruskal算法,其中函数Find的作用是寻找图中顶点所在树的根结点在数组father中的序号。需说明的是,在程序中将顶点的数据类型定义成整型,而在实际应用中,可依据实际需要来设定。

算法5.30

typedef int elemtype;

typedef struct {

elemtype v1;

elemtype v2;

int cost;

}EdgeType;

void Kruskal(EdgeType edges［ ］,int n)

 /*用Kruskal算法构造有n个顶点的图edges的最小生成树*/

{int father［MAXEDGE］;

int i,j,vf1,vf2;

for (i=0;i<n;i++) father［i］=-1;

i=0;j=0;

while(i<MAXEDGE && j<n-1)

{vf1=Find(father,edges［i］.v1);

vf2=Find(father,edges［i］.v2);

if (vf1!=vf2)

{father［vf2］=vf1;

j++;

printf("%3d%3d＼n",edges［i］.v1,edges［i］.v2);

}

i++;

}

}



int Find(int father［ ］,int v)

 /*寻找顶点v所在树的根结点*/

 { int t;

t=v;

while(father［t］>=0)

t=father［t］;

return(t);

 }

在Kruskal算法中,第二个while循环是影响时间效率的主要操作,其循环次数最多为MAXEDGE,其内部调用的Find函数的内部循环次数最多为n,所以Kruskal算法的时间复杂度为O(n·MAXEDGE)。

5.6.3最小生成树算法应用

例5.7农业网(AgriNet)： 给出N个顶点及N个顶点间的距离,然后求一棵最小生成树。先输入顶点数N,然后一个N×N的数组,用来描述各个顶点之间的距离。

输入包含若干种情况,每种情况,第一行是农场数N (3≤N≤100),接着是N×N的邻接距离矩阵,逻辑上说有N行以空格分开的N个整数,物理上说,每行长度限制为80个字符,所以有些行会延续到其他行。要求对每个用例以整数形式输出连接整个农场需要的光纤最小长度。［POJ 1258］


输入示例

4

0 4 9 21

4 0 8 17

9 8 0 16

21 17 16 0



输出示例

28


参考代码如下。

算法5.31

#include<iostream>

using namespace std;



const int INFINITY = 9999999;

const int MAXVEX = 102;    

int edge［MAXVEX］［MAXVEX］, lowcost［MAXVEX］;

int vexNum;     



int myPrim(int start);

int main()

{

while（scanf("%d",&vexNum)!=EOF)

{

for(int i = 1; i<= vexNum; i++)

for(int j = 1; j<= vexNum; j++)

scanf("%d", &edge［i］［j］);

printf("%d＼n",myprim(1));

}

return 0;

}



int myPrim(int start)

{    

int nextVex, minEdge, sumPath = 0;

for(int i = 1; i<= vexNum; i++)

lowcost［i］ = edge［start］［i］;

for(int i = 1; i<vexNum; i++){

minEdge = INFINITY;

nextVex = 1;

for(int j = 2; j<= vexNum; j++){

if((lowcost［j］>0) && (lowcost［j］<minEdge)){

minEdge = lowcost［j］;

nextVex = j;

}

}

sumPath += minEdge;

lowcost［nextVex］ = 0;

for(int j = 1; j<= vexNum; j++){

if((edge［nextVex］［j］<lowcost［j］) && (lowcost［j］>0)){

lowcost［j］ = edge［nextVex］［j］;

}

}

}

return sumPath;

}



观看视频



5.7网络流问题

设给定边容量为Cv,w的有向图G (V,E)。这些容量可以代表通过一个管道的水的容量或在两个交叉路口之间马路上的交通流量。有两个顶点： 一个是s,称为源点(Source)； 另一个是t,称为汇点(Sink)。对于任意一条边(v,w),最多有“流”Cv,w个单位可以通过。在既不是源点s又不是汇点t的任一顶点v,总的进入的流必须等于总的发出的流。最大流问题就是确定从s到t可以通过的最大流量。例如,对于图5.44(a),最大流是5,如图5.44(b)所示。



图5.44一幅图和它的最大流


正如问题叙述中所要求的,没有边负载超过它的容量的流。源点s将5个单位的流分给a和b,顶点a有3个单位的流进入,它将这3个流分转给c和d。顶点d从a和b得到3个单位的流,并把它们结合起来发送到t。一个顶点在不违反边的容量以及保持流守恒(进入必须流出)的前提下,可以按任何方式结合和发送流。

5.7.1网络流的最大流问题

本节开始讨论解决最大流问题的FordFulkerson方法,该方法也称作“扩充路径方法”,该方法是大量算法的基础,有多种实现方法(如EdmondsKarp算法、Dinic算法等)。FordFulkerson算法是一种迭代算法,首先对图中所有顶点对的流清零,此时的网络流大小也为0。在每次迭代中,通过寻找一条“增广路径”(Augument Path)来增加流的值。增广路径可以看作源点s到汇点t的一条路径,并且沿着这条路径可以增加更多的流。迭代直至无法再找到增广路径为止,此时必然从源点到汇点的所有路径中都至少有一条满边。

1. 一个简单的最大流问题

从图G开始并构造一幅流图f,f表示在算法的任意阶段已经达到的流。开始时f的所有边都没有流,希望当算法终止时f包含最大流。再构造一幅图Gf,称为残余图(Residual Graph),它表示对于每条边还能再添加上多少流。对于每一条边,可以从容量中减去当前的流而计算出残余的流。Gf的边叫作残余边(Residual Edge)。

所谓增广通路(Augmenting Path)，指图Gf中从s到t的一条路径,而且在每个阶段,都需要找到这条路径。这条路径上的最小值边就是可以添加到路径每条边上的流量,这可以通过调整f和重新计算Gf来实现。当发现在Gf中没有从s到t的路径时算法终止。这个算法是不确定的,因为从s到t的路径是任意选择的。显然,有些选择会比另外一些选择好,后面再处理这个问题。针对例子运行这个算法。要记着这个算法有一个小欠缺。G、f和Gf的初始配置如图5.45所示。



图5.45图、流图以及残余图的初始阶段


在残余图中有许多从s到t的路径。假设选择s，b，d，t,此时可以发送2个单位的流通过这条路径的每一边。采用如下约定： 一旦注满(使饱和)一条边,则这条边就要从残余图中除去。这样就得到图5.46。



图5.46沿s,b,d,t加入2个单位的流后的G、f、Gf


若选择路径s，a，c，t,该路径也容许2个单位的流通量。进行必要的调整后,得到图5.47中的图。



图5.47沿s,a,c,t加入2个单位的流后的G、f、Gf


唯一剩下可选择的路径是s,a,d,t,这条路径能够容纳一个单位的流通过。结果得到如图5.48所示的图。



图5.48沿s,a,d,t加入1个单位的流后的G、f、Gf——算法终止


由于t从s出发是不可达到的,因此算法到此终止。结果正好5个单位的流是最大值。为了看清问题的所在,设从初始图开始选择路径s,a,d,t，这条路径容纳3个单位的流,从表面上看这是个好选择。然而选择的结果却使得在残余图中不再有从s到t的任何路径,因此,该算法不能找到最优解。这是贪婪算法行不通的一个例子。图5.49指出了为什么算法会失败。



图5.49如果初始动作是沿s,a,d,t加入3个单位的流得到G、f、Gf

——算法终止但解不是最优的



为了使得算法有效,就需要让算法改变它的意向。为此,对于流图中具有流fv,w的每一边(v,w)将在残余图中添加一条容量为fv,w的边(w,v)。事实上,可以通过以相反的方向发回一个流而使算法改变它的意向。通过例子最能看清楚这个问题。从原始的图开始并选择增长通路s,a,d,t得到图5.50中的图。



图5.50使用正确的算法沿s,a,d,t加入3个单位的流后的图


注意,在残余图中有些边在a和d之间有两个方向。或者还有一个单位的流可以从a导向d,或者有高达3个单位的流导向相反的方向——可以撤销流。现在算法找到流为2的增长通路s,b,d,a,c,t。通过从d到a导入2个单位的流,算法从边(a,d)取走2个单位的流,因此本质上改变了它的意向。图5.51显示出新的图。



图5.51使用正确算法沿s,b,d,a,c,t加入2个单位的流后的图


在图5.51中没有增广通路,因此,算法终止。奇怪的是,可以证明,如果边的容量都是有理数,那么该算法总以最大流终止。证明多少有些困难,也超出了本书的范围。虽然例子正好是无环的,但这并不是算法有效工作所必需的。此处使用无环图只是为了简明。

2. FordFulkerson算法的正确性证明


利用最大流最小割定理可以证明FordFulkerson算法的正确性。

最大流最小割定理： 一个网中所有流中的最大值等于所有割中的最小容量。并且可以证明以下3个条件等价。

(1) f是流网络G的一个最大流。

(2)  残留网Gf不包含增广路径。

(3)  G的某个割(S, T),满足f(S, T)  c(S, T)。

证明如下。

(1)  (反证法)假设f是G的最大流,但是Gf中包含增广路径p。显然此时沿着增广路径可以继续增大网络的流,则f不是G的最大流,与条件矛盾。 

(2)  假设Gf中不包含增广路径,即Gf中不包含从s到t的路径。定义： 

S  {v∈V： Gf中包含s到v的路径}

令T  VS,由于Gf中不存在从s到t的路径,因此tS,所以得到G的一个割(S, T)。对每对顶点u∈S,v∈T,必须满足f(u, v)  c(u, v),否则边(u, v)就会存在于Gf的边集合中,那么v就应当属于S(而事实上是v∈T)。所以,f(S, T)  c(S, T)。

(3)  网络的任何流的值都不大于任何一个割的容量,如果G的某个割(S, T),满足f(S, T)c(S, T),则说明割(S, T)的流达到了网络流的上确界,它必然是最大流。

FordFulkerson算法的迭代终止条件是残留网中不包含增广路径,根据上面的等价条件,此时得到的流就是网络的最大流。

3.  FordFulkerson算法的实现

依据上面的讨论,下面给出FordFulkerson算法的伪代码。

算法5.32

Ford-Fulkerson(G, s, t) 

for each edge (u, v)∈E［G］          //初始化每条边的流量为0 

{f［u, v］ = 0; 

f［v, u］ = 0; 

}  

//Gf←G          //初始化剩余网络Gf为原网络G,这里不需要代码  

while there exists a path p from s to t in the network Gf //网络中还存在增广路径,仍然进行迭代 

{search a path p from network Gf   //EdmondsKarp算法采用广度优先搜索算法,Dinic
//算法采用深度优先搜索算法

cf (p)=Min{cf (u, v) | (u, v) is in p}       //确定增广路径上的流增量Δf(p)= cf (p) 

for each edge (u, v) in p

{f［u, v］ = f［u, v］ + cf (p)		　　//增加剩余网络中增广路径上每条边的流量 

f［v, u］ = - f［u, v］                //显然该路径上反方向上的容量为负 

cf ［u, v］ = c［u, v］ - f［u, v］        //计算剩余网络Gf中的每条边的容量 

cf ［v, u］ = c［v, u］ - f［v, u］ 

} 

}

EdmondsKarp算法与FordFulkerson算法的主要区别在于： Karp算法采用广度优先搜索算法寻找一条从s到t最短增广路径; Dinic算法则在层次概念的基础上采用深度优先搜索算法寻找增广路径。

4. EdmondsKarp算法参考模板

为便于读者尽快掌握网络流算法,下面给出一个EdmondsKarp算法的参考模板。

设有n个顶点、m条有向边的网图G,源点为1,汇点为n。每条有向边上的容量和流量分别用c［I,j］和f［I,j］表示,则EdmondsKarp参考代码如下。

算法5.33

#include<iostream>

#include<queue>

using namespace std;

const int maxn=205;

const int inf=0x7fffffff;

int r［maxn］［maxn］;		 //残留网络,初始化为原图

bool visit［maxn］;

int pre［maxn］;

int m,n;

bool bfs(int s,int t)  　　//寻找一条从s到t的增广路径,若找到返回true

{int p;

queue<int>q;

memset(pre,-1,sizeof(pre));

memset(visit,false,sizeof(visit));

pre［s］=s;

visit［s］=true;

q.push(s);

while(!q.empty())

{p=q.front();

q.pop();

for(int i=1;i<=n;i++)

{if(r［p］［i］>0&&!visit［i］)

{

pre［i］=p;

visit［i］=true;

if(i==t) return true;

q.push(i);

}

}

}

return false;

}

int EdmondsKarp(int s,int t)

{  int flow=0,d,i;

while(bfs(s,t))

{d=inf;

for(i=t;i!=s;i=pre［i］)

d=d<r［pre［i］］［i］? d:r［pre［i］］［i］;

for(i=t;i!=s;i=pre［i］)

{r［pre［i］］［i］-=d;

r［i］［pre［i］］+=d;

}

flow+=d;

}

return flow;

}



int main()

{while(scanf("%d%d",&m,&n)!=EOF)

{int u,v,w;

memset(r,0,sizeof(r));  

for(int i=0;i<m;i++)

{scanf("%d%d%d",&u,&v,&w);

r［u］［v］+=w;

}

printf("%d＼n",EdmondsKarp(1,n));

}

return 0;

}



观看视频


5.7.2网络流应用

例5.8草地排水(Drainage Ditches)： 有一个排水系统,有N条排水沟,M个水渠交叉点,每一条排水道都有单位时间水量上限。农夫的池塘在交叉点1，小溪在交叉点m。问单位时间内最多有多少水可以从池塘排到小溪。

有多组测试数据,每组的首行是用空格分隔的两个整数N(0≤N≤200)和M(2≤M≤200),N为排水沟数,M是交叉点数,后续N行包括3个整数Si、Ei和Ci,水流由Si流向Ei(1≤Si,Ei≤M),Ci(0≤Ci≤10000000)表示水流最大速率。每组测试数据输出一个排水最大速率整数。［POJ 1273］


输入示例

1 2 40

1 4 20

2 4 20

2 3 30

5 4

3 4 10

输出示例

50


参考代码如下。

算法5.34

#define VMAX 201

#include<iostream>

using namespace std;

int c［VMAX］［VMAX］; 	　　//容量

int n, m;       　　//分别表示图的边数和顶点数       

int Edmonds_Karp(int s, int t)           //输入源点和汇点

{int p, q, queue［VMAX］, u, v, pre［VMAX］, flow=0, aug;

while(true)

{memset(pre,-1,sizeof(pre));        　　//记录双亲结点

for(queue［p=q=0］=s; p<=q; p++ )    　　//广度优先搜索  

{u= queue［p］;

for(v=0; v<m&&pre［t］<0; v++ )

if(c［u］［v］>0 && pre［v］<0)  

pre［v］=u, queue［++q］=v;

if(pre［t］>=0)    break;

}

if(pre［t］<0)break;        　　//不存在增广路径

aug=0x7fffffff;    		　　//记录最小残留容量

for(u=pre［v=t］; v!=s; v=u,u=pre［u］)

if(c［u］［v］<aug)aug=c［u］［v］;

for(u=pre［v=t］; v!=s; v=u,u=pre［u］)

c［u］［v］-=aug, c［v］［u］+=aug;

flow+=aug;

}

return flow; 

}

 

int main()

{int i,a,b;      

int p［201］［201］;

while(scanf("%d %d",&n,&m)!=EOF&&(n||m))

{memset(c,0,sizeof(c));  

for(i=0;i<n;i++)

{scanf("%d%d",&a,&b);

Sacnf("%d",& p［a-1］［b-1］);

c［a-1］［b-1］+=p［a-1］［b-1］;	　　//两点间可能有多条路径,把权值相加

}

Printf("%d＼n",Edmonds_Karp(0,m-1));　　//源点为0,汇点为顶点数-1 (m-1)

}

return 0;

}

例5.9GSM手机(GSM phone)。［POJ 3549］

描述

Mr. X wants to travel from a point A(Xa, Ya) to a point B(Xb, Yb), A  B. He has a GSM mobile phone and wants to stay available during whole the trip. A local GSM operator has installed K sets of GSM equipment in points Pi(Xi, Yi),1 ≤ i ≤ K. Each set of the equipment provides circular zone Zi. Point Pi is the center of the zone Zi and Ri is its radius. Mobile phones can operate inside such a zone and on its border. Zones can intersect, but no zone completely includes another one.

Your task is to find the length of the shortest way from A to B which is completely covered by GSM zones. You may assume that such a way always exists. Precision of calculations has to be 0.00001.

输入

The first line contains four floating point numbers Xa Ya Xb Yb, separated by one or more spaces. The next line contains single integer number K (K ≤ 200). Each of the rest K lines of the file contains three floating point numbers Xi, Yi, Ri
 separated by one or more spaces. Ri > 0.

输出

The output has to contain a single floating point number.

输入示例输出示例

0 0 8 08.24621

2

0 4 5

8 4 5
参考代码如下。

算法5.35

#include<stdio.h>

#include<string.h>

#include<stdlib.h>

#include<deque>

#include<algorithm>

using namespace std;

int cap［1000］［1000］;

int flow［1000］［1000］;

int a［1000］;

int f;

int p［1000］;

const int inf = 0x7fffffff;



void Edmonds_karp(int N, int M)

{deque<int>q;

int t, u, v, x;

memset(flow, 0, sizeof(flow));

memset(p, 0, sizeof(p));

f = 0;

for (; ; )

{memset(a, 0, sizeof(a));

a［1］ = inf;

q.push_back(1);

while (!q.empty())

{u = q.front(); 

q.pop_front();

for(v = 1;  v<= M;  v++)

if (!a［v］ && cap［u］［v］>flow［u］［v］)

{p［v］ = u;

q.push_back(v);

a［v］ = min(a［u］, cap［u］［v］ - flow［u］［v］);

}

}

if (a［M］ == 0)

break;

for (u = M; u != 1; u = p［u］)

{flow［u］［p［u］］ -= a［M］;

flow［p［u］］［u］ += a［M］;

}

f += a［M］;

}

}



int main()

{int N, M, i, j, a, b, c;

while (scanf("%d%d", &N, &M) != EOF) {

memset(cap, 0, sizeof(cap));

f = 0;

for (i = 0; i<N; i++) {

scanf("%d%d%d", &a, &b, &c);

cap［a］［b］ += c;

}

Edmonds_karp(1, M);

printf("%d＼n",f);

}

return  0;

}


习题




图5.52题（1）图

(1)  已知如图5.52所示的有向图,请给出该图的: 

① 每个顶点的入/出度;  

② 邻接矩阵;  

③ 邻接表;  

④ 逆邻接表;  

⑤ 强连通分量。

(2)  找出图5.53的一个拓扑排序。



图5.53题（2）图


(3)  如果用一个栈代替拓扑排序中的队列,是否会得到不同的排序？哪一种会给出“更好”的答案？

(4)  编写一个程序实现对一幅图的拓扑排序。

(5)  使用标准的二重循环,一个邻接矩阵仅初始化就需要O(|V|2)。试提出一种方法将一幅图存储在一个邻接矩阵中(使得测试一条边是否存在花费O(1)),但避免二次的运行时间。

(6)  请用Kruskal和Prim两种算法分别为图5.54(a)和图5.54(b)构造最小生成树。




(a)




(b)



图5.54题（6）图
(7)  编写一个程序实现Kruskal算法。

(8)  编写一个程序实现Prim算法。

(9)  如果存在一些权值为负的边,那么Prim算法或Kruskal算法还能行得通吗？

(10)  证明V个顶点的图可以有VV2棵最小生成树。

(11)  如果一幅图的所有边权都为1和|E|之间,那么能有多快算出最小生成树？

(12)  给出一个算法求解最大生成树,这比求解最小生成树更难吗？

(13)  设一幅图的所有边的权都为1和|E|之间的整数,Dijkstra算法可以多快实现？

(14)  写出一个算法求解单源最短路径问题。

(15)  ① 解释如何修改Dijkstra算法以得到从v到w的不同的最小路径的个数计数。



图5.55题（16）图

② 解释如何修改Dijkstra算法使得如果存在多于一条从v到w的最小路径,那么具有最少边数的路径将被选中。

(16)  请用图示说明图5.55从顶点a到其余各顶点之间的最短路径。

(17)  找出图5.53中的网络最大流。

(18)  设G (V,E)是一棵树,s是它的根,并且添加一个顶点t以及所有树叶到t的无穷容量的边。给出一个线性时间算法以找出从s到t的最大流。

(19)  给出一个算法找出允许最大流通过的增长通路。

(20)  写出一个求类似图5.53的有向图的网络最大流算法。

(21)  已知AOE网有9个结点： V1、V2、V3、V4、V5、V6、V7、V8、V9，其邻接矩阵如图5.56所示。

① 请画出该AOE图。

② 计算完成整个计划需要的时间。

③ 求出该AOE网的关键路径。







∞645∞∞∞∞∞
∞∞∞∞1∞∞∞∞
∞∞∞∞1∞∞∞∞
∞∞∞∞∞2∞∞∞
∞∞∞∞∞∞97∞
∞∞∞∞∞∞∞4∞
∞∞∞∞∞∞∞∞2
∞∞∞∞∞∞∞∞4
∞∞∞∞∞∞∞∞∞


图5.56题（21）图



(22)  写出一个用邻接矩阵存储图表示的关键路径算法。

(23)  写出将一个无向图邻接矩阵转换成邻接表的算法。

(24)  写出将一个无向图邻接表转换成邻接矩阵的算法。

(25)  试以邻接矩阵为存储结构,分别写出连通图的深度优先搜索和广度优先搜索算法。

(26)  写出建立一幅有向图的逆邻接表的算法。

(27)  G为一n个顶点的有向图,其存储结构分别为： 

① 邻接矩阵。

② 邻接表。

请写出相应存储结构上的计算有向图G出度为0的顶点个数的算法。

(28)  二分图G (V,E)是把V划分成两个子集V1和V2并且其边的两个顶点都不在同一个子集中的图。



图5.57二分图

① 给出一个线性算法以确定一幅图是否是二分图。

② 二分问题是找出E的最大子集E′使得没有顶点含在多于一条的边中。图5.57中所示的是4条边的一个匹配(由虚线表示)。存在一个5条边的匹配,它是最大的匹配。

指出二分匹配问题如何能够用于解决下列问题： 现有一组教师、一组课程,以及每位教师有资格教授的课程表。如果没有教师需要教授多于一门课程,而且只有一位教师可以教授一门给定的课程,那么可以提供开设的课程的最多门数是多少？

③ 证明网络流问题可以用来解决二分匹配问题。

④ 对问题②的解法的时间复杂度如何？

(29) ① 使用Prim和Kruskal两种算法求图5.58中图的最小生成树。

② 这棵最小生成树是唯一的吗？为什么？



图5.58题（29）图


(30)  求出图5.59中图的所有割点。指出深度优先生成树和每个顶点的Num和Low的值。并证明寻找割点的算法的正确性。

(31)  给出一个算法以决定在一幅有向图的深度优先生成森林中的一条边(v,w)是否是树、背向边、交叉边或前向边。

(32)  找出图5.60中的强连通分支。




图5.59题（30）图



图5.60题（32）图



（33） 编写一个程序以找出一幅有向图的强连通分支。


ACM/ICPC实战练习

(1)  POJ 3083,ZOJ 2787,Children of the Candy Corn

(2)  POJ 2251,ZOJ 1940,Dungeon Master

(3)  POJ 1426,ZOJ 1530,Find The Multiple

(4)  POJ 3087,ZOJ 2774,Shuffle'm Up

(5)  POJ 1860,ZOJ 1544,Currency Exchange

(6)  POJ 2253,ZOJ 1942,Frogger

(7)  POJ 1125,ZOJ 1082,Stockbroker Grapevine

(8)  POJ 2240,ZOJ 1092,Arbitrage

(9)  POJ 1789,ZOJ 2158,Truck History

(10)  POJ 2485,ZOJ 2048,Highways

(11)  POJ 1094,ZOJ 1060,Sorting It All Out

(12)  POJ 1459,ZOJ 1734,Power Network

(13)  POJ 3436,ACM Computer Factory

(14)  POJ 3041,ZOJ 1438,Asteroids

(15)  POJ 3020,Antenna Placement

(16)  POJ 1470,ZOJ 1141,Closest Common Ancestors