描述抛掷一颗均匀骰子,观察出现点数的随机试验的随机变量 X, 
其分布律为 X~  1 2 3 4 5 6 
1/6 1/6 1/6 1/6 1/6 1/6!。要描述抛掷两颗均 
匀骰子,观察每个骰子出现点数的随机试验,一个随机变量是不够的。 
设这两颗骰子质地相同,且可辨识。用 X 表示其中一颗出现的点数,Y 
表示另一颗出现的点数,两者都是随机变量,则这个试验的样本点就可 
以用 2-维向量 (X, Y ) 表示。(X, Y ) 的所有可能取值序偶及其对应样本 
点发生的概率可以用表 3-1 表示。 
表 3-1 (X, Y ) 的所有可能取值序偶及其对应样本点发生的概率 
X 
Y 
1 2 3 4 5 6 
1 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
2 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
3 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
4 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
5 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
6 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
由此例可见,对于复杂试验,有时需要用若干个随机变量构成向 
量——随机向量——来描述。不难推想,抛掷三颗均匀骰子的试验需要 
用由三个随机变量 X,Y 和 Z 组成的 3-维向量 (X, Y,Z) 来描述。一 
般地,
定义 3-1 由描述同一个试验 E 的随机变量 X1,X2, · · · ,Xn 组成 
的向量 (X1,X2, · · · ,Xn) 称为n-维随机向量。 
由于涉及的概念、术语,所用的研究方法几乎是一样的,本章主要就
91 
2-维随机向量展开讨论,将一般的 n-维随机向量作为 2-维随机向量的推广。 
3.1 2-维随机向量的联合分布函数 
定义 3-2 给定 2-维随机向量 (X, Y ),对 x, y ∈ R,定义 
F(x, y) = P(X . x, Y . y) = P({X . x} ∩ {Y . y}) 
为 (X, Y ) 的联合分布函数,简称为分布函数。 
按此定义,F(x, y) 为 (X, Y ) 的取值序偶落在如图 3-1 所示的平面区域内的概率。 
图 3-1 事件 {X . x, Y . y} = {X . x} ∩ {Y . y} 
与随机变量的分布函数相仿,随机向量的联合分布函数也有许多优良的性质。 
定理 3-1 设 2-维随机向量 (X, Y ) 的分布函数为 F(x, y),则: 
(1) 有界性:0 . F(x, y) . 1。 
(2) 规范性: lim 
x→.∞
F(x, y) = lim 
y→.∞
F(x, y) = lim 
x→.∞ y→.∞ 
F(x, y) = 0, lim xy→→∞∞
F(x, y) = 1。 
(3) 单调性:F(x, y) 分别关于 x,y 单调不减。 
(4) 连续性:F(x, y) 分别关于 x,y 至少右连续。 
(5) P(x1 < X . x2, y1 < Y . y2) = F(x1, y1) . F(x1, y2) . F(x2, y1) + F(x2, y2)。 
对比随机变量 X 的分布函数 F(x) 定义及其性质(详见定理 2-1),不难理解 2-维 
随机向量 (X, Y ) 的量和分布函数 F(x, y) 的各条性质的意义。 
性质(1)~(4)的几何意义是 F(x, y) 的图形是位于平行平面 z = 0 和 z = 1 之 
间的一块曲面,如图 3-2 所示。
92 
图 3-2 一个 2-维随机变量的联合分布函数图形 
而性质(5)的几何意义则由图 3-3 所示。 
图 3-3 {x1 < X . x2, y1 < Y . y2} = ({X . x2, Y . y2}.{X . x2, Y . y1}.{X . x1, Y . y2}) 
∪ {X . x1, Y . y1} 
例 3-1 设 2-维随机向量 (X, Y ) 的分布函数为 
F(x, y) = 
1 
π2 A + arctan x
2 B + arctan y
3, x, y ∈ R 
(1)确定 A、B 的值。 
(2)计算 P(X . 2, Y . 3)。 
解:(1)由分布函数的规范性: lim 
x→.∞ y→.∞ 
F(x, y) = 0 和 lim xy→→∞∞
F(x, y) = 1,得 
8>
><>
>: 
1 
π2 A . 
π
2 B . 
π
2 = 0 
1 
π2 A + 
π
2 B + 
π
2 = 1 
解此方程组得 A = B = 
π
2 
。即
93 
F(x, y) = 
1 
π2 π
2 
+ arctan x
2 π
2 
+ arctan y
3, x, y ∈ R 
(2)P(X . 2, Y . 3) = F(2, 3) = 
1 
π2 π
2 
+ arctan 1π
2 
+ arctan 1= 9/16。 
练习 3-1 对例 3-1,计算概率 P(0 < X . 2, 0 < Y . 3)。 
参考答案:1/16。 
3.2 离散型 2-维随机向量 
3.2.1 离散型 2-维随机向量的联合分布律 
定义 3-3 构成 2-维随机向量 (X, Y ) 的两个变量 X、Y 都是离散型的,称为2-维 
离散型随机向量。 
定义3-4 设 (X, Y ) 为 2-维离散型随机向量,X 与 Y 的所有取值分别为 {x1, x2, · · · , 
xn, · · · } 和 {y1, y2, · · · , ym, · · · }。不失一般性,假定 x1 < x2 < · · · < xn < · · · 及 
y1 < y2 < · · · < ym < · · · ,记 
P(X=xi, Y =yj)=P({X=xi} ∩ {Y =yj})=pij , i=1, 2, · · · , n, · · · , j=1, 2, · · · , m, · · · 
称为 (X, Y ) 的联合分布律,简称为分布律。 
2-维离散型随机向量的联合分布律可以用列表表示(本书约定,向量 (X, Y ) 的第 
一坐标 X 的取值纵向展开,第二坐标 Y 的取值横向展开),如表 3-2 所示。 
表 3-2 2-维离散型随机向量的联合分布律 
X 
Y 
y1 y2 · · · yj · · · yn · · · 
x1 p11 p12 · · · p1j · · · p1n · · · 
x2 p21 p22 · · · p2j · · · p2n · · · ... 
... 
... 
· · · 
... 
· · · 
... 
· · · 
xi pi1 pi2 · · · pij · · · pin · · · ... 
... 
... · · · 
... 
· · · 
... 
· · · 
xm pm1 pm2 · · · pmj · · · pmn · · · ... 
... 
... 
· · · 
... 
· · · 
... 
· · · 
与离散型随机变量分布律相仿,2-维离散型随机向量的联合分布律有如下性质。 
定理 3-2 设离散型 2-维随机向量的联合分布律为 P(X = xi, Y = yj) = P({X = 
xi} ∩ {Y = yj}) = pij , i = 1, 2, · · · , n, · · · , j = 1, 2, · · · , m, · · · ,则 
(1)有界性:0 . pij . 1。 
(2)归一性: ∞Pi=1 
∞Pj=1 
pij = 1。 
(3)分布函数:F(x, y) = P xi.x P yj.y 
pij。
94 
应当说明的是 X 或 Y 的取值为有限多个,则性质(2)中的求和也是有限的。 
例 3-2 盒子里有 2 个黑球、2 个红球、2 个白球。在其中任取 2 个球,以 X 表 
示取得的黑球个数,以 Y 表示取得的红球个数。写出 (X, Y ) 的联合分布律,并计算概 
率 P(X + Y . 1)。 
解:X 和 Y 的取值范围均为 {0, 1, 2}。P(X = 0, Y = 0) = P(取得的 2 个球均为白 
色的) = C22
/C26
= 1/15。类似地,有 P(X = 2, Y = 0) = P(X = 0, Y = 2) = 
1/15。P(X = 0, Y = 1) = P(取得 1 个红球 1 个白球) = C12 
· C12
/C26
= 4/15。类似 
地,P(X = 1, Y = 0) = P(X = 1, Y = 1) = 4/15。不难理解,P(X = 1, Y = 2) = 
P(X = 2, Y = 1) = P(X = 2, Y = 2) = 0。于是,(X, Y ) 的联合分布律写成表格如 
表 3-3 所示。 
表 3-3 (X, Y ) 的联合分布律 
X 
Y 
0 1 2 
0 
1 
15 
4 
15 
1 
15 
1 
4 
15 
4 
15 
0 
2 
1 
15 
0 0 
考虑事件 X + Y . 1:{X = 0, Y = 0} ∪ {X = 0, Y = 1} ∪ {X = 1, Y = 0}。于 
是 P(X + Y . 1) = P(X = 0, Y = 0) + P(X = 0, Y = 1) + P(X = 1, Y = 0) = 
1/15 + 4/15 + 4/15 = 9/15 = 3/5。 
练习 3-2 一个口袋中有 4 个球,它们上面分别标有数字 1、2、2、3。从这个口 
袋中任取一个球后,不放回袋中,再从袋中任取一个球。依次以 X、Y 表示第一次、第 
二次取得的球上标有的数字。写出 (X, Y ) 的联合分布律。 
参考答案: 
X 
Y 
1 2 3 
1 0 
1
6 
1 
12 
2 
1
6 
1
6 
1
6 
3 
1 
12 
1
6 
0
95 
3.2.2 离散型 2-维随机向量的边缘分布与条件分布 
给定 2-维离散型随机向量 (X, Y ) 的联合分布律 
P(X = xi, Y = yj) = pij , i, j = 1, 2, · · · 
给定 j,考虑概率 P(Y = yj)。由于事件 Y = yj 与事件 X = x1,X = x2,· · · 有关, 
所以按全概率公式有 
P(Y = yj) = P(X = x1)P(Y = yj |X = x1) + P(X = x2)P(Y = yj |X = x2) + · · · 
= P(X = x1, Y = yj) + P(X = x2, Y = yj) + · · · 
= p1j + p2j + · · · = 
∞Xi=1 
pij 
= p·j 
其中,j = 1, 2, · · · 。称为 Y 的边缘分布。 
类似地,X 的边缘分布为 P(X = xi) = 
∞Pj=1 
pij = pi·,i = 1, 2, · · · 。若将联合分布 
律表示成表格,则可按行(列)相加得到 X(Y )的边缘分布,如表 3-4 所示。习惯上 
写在联合分布律的右边缘和下边缘,所以称为边缘分布。 
表 3-4 2-维离散型随机向量的边缘分布 
X 
Y 
y1 y2 · · · yj · · · yn · · · P(X = xi) 
x1 p11 p12 · · · p1j · · · p1n · · · p1· 
x2 p21 p22 · · · p2j · · · p2n · · · p2· ... 
... 
... 
· · · 
... · · · 
... 
· · · 
... 
xi pi1 pi2 · · · pij · · · pin · · · pi· ... 
... 
... 
· · · 
... 
· · · 
... 
· · · 
... 
xm pm1 pm2 · · · pmj · · · pmn · · · pm· ... 
... 
... · · · 
... 
· · · 
... 
· · · 
... 
P(Y = yj) p·1 p·2 . . . p·j · · · p·n · · · 1 
注意,右下角的“1”表明无论是联合分布律还是边缘分布律,都遵从归一性。 
例 3-3 从含有 3 个正品、2 个次品的 5 个产品中依次无放回地抽取两个。设 X 
表示第 1 次取到的次品个数,Y 表示第 2 次取到的次品个数。求 (X, Y ) 的联合分布律 
以及 X 和 Y 的边缘分布。 
解:显然,X 和 Y 的所有可能取值均为 {0, 1}。由于是无放回抽取, 
P(X = i, Y = j) = P(X = i)P(Y = j|X = i), i, j = 0, 1
96 
P(X = 0, Y = 0) = (3/5)(2/4) = 3/10,P(X = 0, Y = 1) = (3/5)(2/4) = 3/10, 
P(X = 1, Y = 0) = (2/5)(3/4) = 3/10,P(X = 1, Y = 1) = (2/5)(1/4) = 1/10。 
于是,(X, Y ) 的联合分布律可以列成表格,如表 3-5 所示。 
表 3-5 (X, Y ) 的联合分布律 
X 
Y 
0 1 P(X = k) 
0 
3 
10 
3 
10 
3
5 
1 
3 
10 
1 
10 
2
5 
P(Y = k) 
3
5 
2
5 
1 
对联合分布律表格,按行相加,得到 X 的边缘分布(写在右边缘);按列相加,得 
到 Y 的边缘分布(写在下边缘)。 
练习 3-3 例 3-3 中按有放回抽取方式,计算 (X, Y ) 的联合分布律以及 X 和 Y 
的边缘分布。 
参考答案: 
X 
Y 
0 1 P(X = k) 
0 
9 
25 
6 
25 
3
5 
1 
6 
25 
4 
25 
2
5 
P(Y = k) 
3
5 
2
5 
1 
设 (X, Y ) 为 2-维离散型随机向量,联合分布律为 P(X = xi, Y = yj) = pij, 
i, j = 1, 2, · · · 。实践中,常需计算对特定的 i,计算 P(Y = yj |X = xi),j = 1, 2, · · · 。 
称为已知 X = xi 的条件下,Y 的条件分布。对特定的 i,Y 的条件分布 
P(Y = yj |X = xi) = 
P(X = xi, Y = yj) 
P(X = xi) 
= 
pij 
pi· 
, j = 1, 2, · · · 
即用 X 的边缘分布中第 i 取值的概率遍除联合分布律表格中对应行的每一项,便得所 
求。
类似地, 
P(X = xi|Y = yj) = 
pij 
p·j 
, i = 1, 2, · · ·
97 
称为 Y = yj 条件下,X 的条件分布。 
例 3-4 为求例 3-3 中已知 X = 1 的条件下 Y 的条件分布,由 X 的边缘分布 
得 P(X = 1) = 2/5,用其遍除联合分布律中对应 X = 1 的那一行中的概率,P(X = 
1, Y = 0) = 3/10, P(X = 1, Y = 1) = 1/10。得到条件分布的分布律,如表 3-6 
所示。 
表 3-6 条件分布的分布律 
X 
Y 
0 1 P(X = k) 
0 
3 
10 
3 
10 
3
5 
1 
3 
10 
1 
10 
2
5 
P(Y = k) 
3
5 
2
5 
1 
Y 0 1 
P(Y |X = 1) 
3/10 
2/5 
= 
3
4 
1/10 
2/5 
= 
1
4 
也就是说,若已知第一次取得次品,则有 3/4 的把握,预测第二次取得正品;有 
1/4 的把握预测取到次品。 
练习 3-4 计算例 3-4 中 Y = 0 的条件下,X 的分布律。 
参考答案:(X|Y = 0)~0@
0 1 
1
2 
1
2
1A
。 
3.2.3 离散型随机变量的独立性 
设离散型随机向量 (X, Y ) 的联合分布律为 P(X = xi, Y = yj) = pij , i, j = 
1, 2, · · · 。X,Y 的边缘分布律分别为 P(X = xi) = pi·, i = 1, 2, · · · ,P(Y = yj) = 
p·j , j = 1, 2, · · · 。我们知道, 
P(X = xi, Y = yj) = P(X = xi)P(Y = yj |X = xi), i, j = 1, 2, · · · 
此时,若有 P(Y = yj |X = xi) = P(Y = yj), i, j = 1, 2, · · · ,即条件概率与无条件概率 
相等,则
pij = P(X = xi, Y = yj) = P(X = xi)P(Y = yj) = pi·p·j , i, j = 1, 2, · · · 
称 X 与 Y 相互独立。
98 
例 3-5 例 3-3 中在 3 个正品、2 个次品的 5 个产品中依次无放回地抽取两个,X, 
Y 分别表示第一次和第二次取得的次品数。(X, Y ) 的联合分布律和 X,Y 的边缘分布 
律如表 3-7 所示。 
表 3-7 (X, Y ) 的联合分布律和 X, Y 的边缘分布律 
X 
Y 
0 1 P(X = k) 
0 
3 
10 
3 
10 
3
5 
1 
3 
10 
1 
10 
2
5 
P(Y = k) 
3
5 
2
5 
1 
很明显,P(X = 0, Y = 0) = 3/10 .= (3/5)(3/5) = P(X = 0) · P(Y = 0)。故 X,Y 
不相互独立。然而,在练习 3-3 中,换成有放回抽取方法,则 (X, Y ) 的联合分布律和 
X,Y 的边缘分布律如表 3-8 所示。 
表 3-8 有放回抽取方法下 (X, Y ) 的联合分布律和 X, Y 的边缘分布律 
X 
Y 
0 1 P(X = k) 
0 
9 
25 
6 
25 
3
5 
1 
6 
25 
4 
25 
2
5 
P(Y = k) 
3
5 
2
5 
1 
不难验算,P(X = i, Y = j) = P(X = i)P(Y = j),i, j = 0, 1。所以,在有放回抽 
取方式下,X,Y 是相互独立的。 
随机变量 X 和 Y 相互独立的意义就是 X 的取值不影响 Y 的取值,反之亦然。 
离散型随机变量的独立性告诉我们,若 X 与 Y 相互独立,则由 X、Y 的边缘分 
布律可得 (X, Y ) 的联合分布律。例如,本章开头提到的抛掷两颗均匀骰子,观察它 
们出现的点数 (X, Y ) 的试验,不难理解 X 与 Y 是相互独立的。X 与 Y 的分布 
律均为   1 2 3 4 5 6 
1/6 1/6 1/6 1/6 1/6 1/6!。所以可得 (X, Y ) 的联合分布律如表 3-9 
所示。
99 
表 3-9 (X, Y ) 的联合分布律 
X 
Y 
1 2 3 4 5 6 
1 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
2 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
3 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
4 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
5 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
6 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
练习 3-5 已知 (X, Y ) 的分布律如表 3-10 所示。 
表 3-10 (X, Y ) 的分布律 
X 
Y 
1 2 3 
1 
1 
12 
1 
12 
1 
12 
2 
2 
12 
1 
12 
0 
3 
2 
12 
1 
12 
0 
4 
1 
12 
1 
12 
1 
12 
(1) 计算 X 和 Y 的边缘分布律。 
(2) 计算 X = 4 下 Y 的条件分布律和 Y = 3 下 X 的分布律。 
(3) 判断 X 与 Y 是否相互独立。 
参考答案: (1) X~0@
1 2 3 4 
1
4 
1
4 
1
4 
1
4
1 A,Y ~0@
1 2 3 
1
2 
1
3 
1
6
1A
; 
(2)Y |(X = 4)~0@
1 2 3 
1
3 
1
3 
1
3
1A
,X|(Y = 3)~0@
1 2 3 4 
1
2 
0 0 
1
2
1A
;(3)不独立。 
3.2.4 Python 解法 
本节中,假定 2-维离散型随机向量 (X, Y ) 的联合分布律如表 3-11 所示。
100 
表 3-11 (X, Y ) 的联合分布律 
X 
Y 
y1 y2 · · · yn 
x1 p11 p12 · · · p1n 
x2 p21 p22 · · · p2n 
... 
... 
...
... 
... 
xm pm1 pm2 · · · pmn 
即随机变量 X 取 m 个值,Y 取 n 个值,如果只关注 (X, Y ) 的联合分布中的概率 
值,则联合分布律可简约地表示成一个 m × n 的矩阵,记为 PXY ,即 
PXY =
0BBBBB@ 
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA 
1. 联合分布律的表示 
Python 的 scipy.stats 包并未提供 2-维分布,但 numpy 包的 array 数组类对象却 
能很好地表示这样的 2-维离散型随机向量的联合分布律。 
例 3-6 下列代码表示例 3-3 中的随机向量 (X, Y ) 的联合分布律中由概率构成的 
矩阵 PXY =0B@
3 
10 
3 
10 
3 
10 
1 
10
1CA
。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R 
3 Pxy=np.array([[R(3,10), R(3,10)], #创建2-维数组Pxy 
4 [R(3,10), R(1,10)]]) 
5 print(Pxy) #输出2-维数组 
程序 3.1 用 numpy 的 array 类对象表示 2-维离散型随机向量分布律 
第 3~4 行创建一个名为 Pxy 的 array 类对象,将其设置为两个等长的数组的数组,从 
而构成一个矩阵。Pxy 中的每一个元素设置为表示有理数的 Rational 对象(第 2 行导 
入,别名为 R)。运行该程序,输出如下。 
[[3/10 3/10] 
[3/10 1/10]] 
练习 3-6 用 numpy.array 表示练习 3-5 中随机向量 (X, Y ) 的联合分布律中的概 
率矩阵 PXY 。 
参考答案:见文件 chapter03.ipynb 中对应代码。
101 
2. 边缘分布的计算 
由例 3-6 可见,numpy 的 array 类对象可将矩阵表示为 2-维数组——数组的数组。 
2-维数组有两个“轴”:纵向记为 axis=0,横向记为 axis=1,如图 3-4 所示。 
图 3-4 numpy 的 array 对象表示 2-维数组结构 
为计算变量 X 及 Y 的边缘分布律,可调用 array 类对象 Pxy 的 sum 函数,指定 
按行对列标 j(axis=1)相加得到 X 的边缘分布律的概率列向量,这是一个具有 m 个 
元素的数组,记为 Px;按列对行标 i(axis=0)相加得 Y 的边缘分布律的概率行向量, 
是一个具有 n 个元素的数组,记为 Py。下列程序定义了按此方法根据联合分布律的概 
率矩阵 PXY 计算边缘分布律概率向量 PX 和 PY 的 Python 函数。 
1 import numpy as np #导入numpy 
2 def margDist(Pxy): #定义计算边缘分布的函数 
3 Px=Pxy.sum(axis=1) #按行相加得X分布律 
4 Py=Pxy.sum(axis=0) #按列相加得Y分布律 
5 return (Px.reshape(Px.size, 1), #返回Px,Py 
6 Py.reshape(1, Py.size)) 
程序 3.2 计算边缘分布的 Python 函数定义 
程序 3.2 中第 2~5 行定义了用于根据 (X, Y ) 的联合分布律计算 X 和 Y 的边缘分 
布的函数 margDist。参数 Pxy 是组织为 2-维数组的 (X, Y ) 的联合分布律中的概率矩 
阵。第 3 行、第 4 行分别对 Pxy 按行相加和按列相加得到 X、Y 的边缘分布律存于 
Px 和 Py。第 5~6 行将 Px,Py 作为返回值返回。需要提及的是,为将 array 类对象表 
示的 1-维数组设置为一个列向量或行向量,以便与 2-维数组表示的矩阵进行统一的运 
算,要调用该数组的 reshape 函数。因此,第 5 行返回的 Px 为列向量 
0BBBBB@ 
p1· 
p2· ... 
pm·
1CCCCCA 
Py 为行向量 (p·1, p·2, · · · , p·n)。将程序 3.2 的代码写入文件 utility.py,便于调用。
102 
例 3-7 下列代码计算例 3-3 的随机向量 (X, Y ) 中的 X 和 Y 的边缘分布的概率 
向量。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R #导入Rational 
3 from utility import margDist #导入margDist 
4 Pxy=np.array([[R(3,10), R(3,10)], #创建联合分布律Pxy 
5 [R(3,10), R(1,10)]]) 
6 Px, Py=margDist(Pxy) #计算边缘分布律 
7 print(’Px:%s’%Px) 
8 print(’Py:%s’%Py) 
程序 3.3 验算例 3-3 中 X 与 Y 的边缘分布的 Python 程序 
第 4~5 行设置 (X, Y ) 的联合分布律的概率矩阵 Pxy。第 6 行调用程序 3.2 定义的 
函数 margDist(第 3 行导入),计算结果赋予 Px,Py。运行程序,输出如下。 
Px:[[3/5] 
[2/5]] 
Py:[[3/5 2/5]] 
此即例 3-3 的计算结果。 
练习 3-7 利用程序 3.2 定义的 margDist 函数计算练习 3-5 的随机向量 (X, Y ) 中 
X 和 Y 的边缘分布的概率向量。 
参考答案:见文件 chapter03.ipynb 中对应代码。 
3. 条件分布的计算 
计算 2-维离散型随机向量 (X, Y ) 的条件分布律,譬如 P(X|Y = yj),就是用 Y 的 
边缘分布中的 P(Y = yj) = p·j 遍除联合分布律中第 j 列中每个元素 pij,i = 1, 2, · · · n。 
即 
0BBBBB@ 
p1j/p·j 
p2j/p·j 
... 
pmj/p·j
1CCCCCA
, j = 1, 2, · · · , n 
也就是说,矩阵 
0BBBBB@ 
p11/p·1 p12/p·2 · · · p1n/p·n 
p21/p·1 p22/p·2 · · · p2n/p·n 
... 
...
... ... 
pm1/p·1 pm2/p·2 · · · pmn/p·n
1CCCCCA
表示出了所有已知 Y 取一值,X 的条件分布。幸运的是,numpy 的 array 类对象表示 
的一个 m × n 的矩阵 A 与一个具有同结构的矩阵,或具有 m 个元素的列向量或具有
103 
n 个元素的行向量 B 支持包括“+”“.”“*”“/”等的按元素运算。例如, 
0BBBBB@ 
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA
p·1 p·2 · · · p·n=
0BBBBB@ 
p11/p·1 p12/p·2 · · · p1n/p·n 
p21/p·1 p22/p·2 · · · p2n/p·n 
... 
...
... ... 
pm1/p·1 pm2/p·2 · · · pmn/p·n
1CCCCCA 
及 
0BBBBB@
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA 
0BBBBB@ 
p1· 
p2· ... 
pm·
1CCCCCA
= 
0BBBBB@ 
p11/p1· p12/p1· · · · p1n/p1· 
p21/p2· p22/p2· · · · p2n/p2· ...
...
... ... 
pm1/pm· pm2/pm· · · · pmn/pm·
1CCCCCA 这恰与我们根据联合分布律与 Y 和 X 的边缘分布律分别计算条件分布 P(X|Y ) 和 
P(Y |X) 的方式不谋而合。我们将上述计算而得的表示 P(X|Y ) 的矩阵记为 PX|Y ,表 
示 P(Y |X) 的矩阵记为 PY |X。 
利用 numpy 的 array 类的这一技术,定义如下的计算 2-维离散型随机向量的条件 
分布的 Python 函数。 
1 from utility import margDist #导入margDist 
2 def condDist(Pxy): #定义计算条件分布的函数 
3 Px, Py=margDist(Pxy) #计算边缘分布 
4 Px_y=Pxy/Py #计算P(X|Y) 
5 Py_x=Pxy/Px #计算P(Y|X) 
6 return Px_y, Py_x
程序 3.4 计算条件分布的 Python 函数定义 
函数 condDist 的参数 Pxy 是 (X, Y ) 的联合分布律的概率值矩阵。第 3 行调用程序 3.2 
中定义的计算边缘分布的函数 margDist(Pxy)(第 1 行导入),计算 X 和 Y 的边缘分布 
律的概率值序列,存于 Px(列向量),Py(行向量)。第 4 行、第 5 行分别计算 P(X|Y ) 
和 P(Y |X)。为便于调用,将程序 3.4 的代码写入文件 utility.py。 
例 3-8 下列代码验算例 3-4 中条件分布 Y |X = 1 和练习 3-4 中条件分布 X|Y = 
0。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R #导入Rational 
3 from utility import condDist #导入condDist 
4 Pxy=np.array([[R(3,10), R(3,10)], #创建联合分布律Pxy 
5 [R(3,10), R(1,10)]]) 
6 Px_y, Py_x=condDist(Pxy) #计算条件分布律
104 
7 print(’P(X|Y=0):%s’%Px_y[:,0]) #输出Px|y=0 
8 print(’P(Y|X=1):%s’%Py_x[1]) #输出Py|x=1 
程序 3.5 验算例 3-4 中条件分布律的 Python 程序 
程序的第 6 行调用程序 3.3 中定义的计算条件分布的函数 condDist(Pxy),计算由 Pxy 
表示的联合分布律的 2-维离散型随机向量 (X, Y ) 的条件分布律 P(X|Y ) 和 P(Y |X), 
存储于 Px_y 和 Py_x。其第 1 列数据 Px_y[:,0] 和第 2 行数据 Py_x[1] 恰为条件分 
布 P(X|Y = 0) 和 P(Y |X = 1) 的概率。运行此程序,将输出 
P(X|Y=0):[1/2 1/2] 
P(Y|X=1):[3/4 1/4] 
其中,P(Y|X=1) 的数据 3/4 和 1/4 恰为例 3-4 中 P(Y |X = 1) 的计算结果;P(X|Y=0) 
的数据 1/2 和 1/2 恰为练习 3-4 中 P(X|Y = 0) 的计算结果。 
练习 3-8 利用 condDist 函数计算练习 3-5 的随机向量 (X, Y ) 条件分布 Y |X = 4 
和 X|Y = 3。 
参考答案:见文件 chapter03.ipynb 中对应代码。 
4. 独立性判断 
随机变量之间的独立性是非常重要的关系。对有限取值的离散型随机变量 X,Y 
而言,我们知道 X,Y 独立,当且仅当 pij = pi· · p·j , 1 . i . m, 1 . j . n。用矩阵表 
示为 
0BBBBB@ 
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA
=
0BBBBB@ 
p1· · p·1 p1· · p·2 · · · p1· · p·n 
p2· · p·1 p2· · p·2 · · · p2· · p·n 
... 
...
... ... 
pm· · p·1 pm· · p·2 · · · pm· · p·n
1CCCCCA 
而 
0BBBBB@ 
p1· · p·1 p1· · p·2 · · · p1· · p·n 
p2· · p·1 p2· · p·2 · · · p2· · p·n 
... 
...... ... 
pm· · p·1 pm· · p·2 · · · pm· · p·n
1CCCCCA
=
0BBBBB@ 
p1· 
p2· ... 
pm·
1CCCCCA
· (p·1, p·2, · · · , p·n) 
将 (X, Y ) 的联合分布律中的概率值矩阵记为 PXY ,X 的边缘分布概率值列向量表为 
PX,Y 的边缘分布概率值行向量表为 PY 。这样,为验证 X 与 Y 是否相互独立,只 
需验证 
PXY = PX · PY 
是否成立。
105 
下列代码定义了根据有限取值的 (X, Y ) 的联合分布律概率值矩阵 PXY ,判断两个 
离散型随机变量 X 与 Y 是否独立的 Python 函数。 
1 import numpy as np #导入numpy 
2 from utility import margDist #导入margDist 
3 def independent(Pxy): #判断X,Y是否独立的函数定义 
4 Px, Py=margDist(Pxy) #计算边缘分布 
5 PxPy=Px.Py #计算边缘分布的积矩阵 
6 if PxPy.dtype==float64: #若数据是浮点型 
7 return (abs(PxPy.Pxy)<1e.8).all() 
8 return (PxPy==Pxy).all() #数据是有理数型 
程序 3.6 验证离散型随机变量 X,Y 是否相互独立的 Python 函数定义 
程序的第 3~8 行定义判断随机变量 X 与 Y 是否独立的函数 independent,参数 
Pxy 为 (X, Y ) 的联合分布律的概率矩阵。第 4 行调用程序 3.2 定义的函数 margDist(第 
2 行导入)计算 X 与 Y 的边缘分布律概率序列,分别记为 Px 和 Py(注意 Px 和 Py 分 
别为列向量和行向量)。第 5 行计算 Px 与 Py 的按元素积矩阵,结果存于 PxPy。第 6~7 
行的 if 语句,对数组元素类型为浮点型 float 的情形,调用矩阵 abs(PxPy.Pxy)<1e-8 
的 all 函数,判断 PxPy 中每个元素与矩阵 Pxy 中对应元素之差的绝对值是否全部小 
于 10.8。此处,abs(PxPy.Pxy)<1e-8 是一个形状与 Pxy(或 PxPy)相同的矩阵,其 
中每个元素为 |pi· · p·j . pij | < 10.8 是否成立,是为 True,否为 False。若该矩阵的 
所有元素均为 True,则 all() 返回 True。否则,返回 False。类似地,对于数据类型为 
Rational 的情形,第 8 行调用 (Pxy==Pxpy).all(),判断 X 与 Y 的相互独立性。将程 
序 3.6 的代码写入文件 utility.py,方便调用。 
例 3-9 利用程序 3.6 定义的 independent 函数,下列代码为就例 3-5 中无放回抽 
样和有放回抽样得到的变量 X 与 Y 的独立性的检测。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R #导入Rational 
3 from utility import independent #导入independent 
4 Pxy=np.array([[R(3,10), R(3,10)], [R(3,10), R(1,10)]]) #无放回抽样分布律 
5 print(’无放回抽样,X与Y相互独立是%s’%independent(Pxy)) 
6 Pxy=np.array([[9/25, 6/25], [6/25, 4/25]]) #有放回抽样分布律 
7 print(’有放回抽样,X与Y相互独立是%s’%independent(Pxy)) 
程序 3.7 对无放回抽样和有放回抽样验证离散型随机变量 X,Y 的相互独立性 
程序中,第 4 行和第 6 行分别设置 (X, Y ) 在无放回抽样下和有放回抽样下的联合 
分布律。第 5 行和第 7 行分别调用 independent 函数验算两个不同抽样下 X,Y 的相 
互独立性。注意,第 4 行设置 Pxy 时,元素为 Rational 类型,而第 6 行设置成 float 
型。运行程序,输出如下。
106 
无放回抽样,X与Y相互独立是False 
有放回抽样,X与Y相互独立是True 
即在无放回抽样下,判断 X 与 Y 不是相互独立的,而在有放回抽样下 X 与 Y 是相互 
独立的。 
练习 3-9 在 Python 中验算练习 3-5 中随机向量 (X, Y ) 的独立性判断。 
参考答案:见文件 chapter03.ipynb 对应代码。 
3.3 连续型 2-维随机向量 
3.3.1 连续型 2-维随机向量的联合密度函数 
定义 3-5 设 F(x, y) 是 2-维随机向量 (X, Y ) 的联合分布函数,若有非负函数 
f(x, y) 使得 
F(x, y) = ∫x
.∞ ∫y
.∞ 
f(s, t)dsdt 
称 (X, Y ) 是连续型 2-维随机向量,f(x, y) 称为 (X, Y ) 的联合密度函数,简称为密度 
函数。
连续型 2-维随机向量的联合分布函数 F(x, y) 在实平面 R2 的任一点 (x, y) 处都是 
连续的。 
定理 3-3 设 f(x, y) 为连续型 2-维随机向量 (X, Y ) 的密度函数,则 
(1)非负性:f(x, y) . 0。 
(2)归一性:∫+∞ 
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy = 1。 
(3)若 f(x, y) 在 (x, y) 处连续,则 f(x, y) = 
.2F(x, y) 
.x.y 
。 
(4)设 D . R2,则 P((X, Y ) ∈ D) = ∫∫ D 
f(x, y)dxdy。 
这些性质与随机变量的密度函数的性质(见定理 2-4)十分相似。图 3-5 展示了一个 
典型的连续型 2-维随机向量的联合密度函数的图形。其非负性决定了曲面 z = f(x, y) 
位于平面 z = 0 的上方。归一性说明由曲面 z = f(x, y) 和平面 z = 0 围成的空间区域 
体积为 1。 
例 3-10 设连续型 2-维随机向量 (X, Y ) 的密度函数为 
f(x, y) =8<:
Ax, 0 < x < 1, 0 < y < x 
0, 其他 
计算:(1) 系数 A;(2) 概率 P(X . 3/4)。
107 
图 3-5 典型的连续型 2-维随机向量的联合密度函数的图形 
解:(1)利用 f(x, y) 的归一性,有 
1 = ∫+∞ 
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy = ∫1 
0 ∫x 
0 
Axdxdy = ∫1 
0 
Axdx ∫x 
0 
dy = A∫1 
0 
x2dx = 
A
3 
得 A = 3。于是 
f(x, y) =8<:
3x, 0 < x < 1, 0 < y < x 
0, 其他 
(2)考虑平面上表示事件 X . 3/4 的区域 
D = {(x, y)|x . 3/4} = {(x, y)|3/4 . x < +∞,.∞ < y < +∞} 
如图 3-6 中直线 x = 3/4 右侧部分。而联合密度函数 f(x, y) 非零区域为图中由 x = 1, 
y = 0 和 y = x 围成的三角形部分。两者的交集为图中深色区域,即 3/4 . x . 1, 0 . 
y . x。于是 
P(X . 3/4) = ∫∫ D 
f(x, y)dxdy = ∫∞
3/4 ∫+∞ 
.∞ 
f(x, y)dxdy = ∫1 
3/4 ∫x 
0 
3xdxdy 
= 3 ∫1 
3/4 
x∫x 
0 
dydx = 3 ∫1 
3/4 
x2dx = 1 . 3
43 
= 
37 
64 
练习 3-10 对例 3-10 中随机向量 (X, Y ) 计算概率 P(X < 1/4, Y < 1/2)。 
参考答案:1/64。
108 
图 3-6 平面上表示事件 X . 3/4 的区域及 f(x, y) 取非零值的区域 
3.3.2 连续型 2-维随机向量的边缘分布与条件分布 
1. 边缘分布 
设随机向量 (X, Y ) 的密度函数为 f(x, y),分布函数为 F(x, y),即 
F(x, y) = ∫x
.∞ ∫y
.∞ 
f(s, t)dxdy 
称 
FX(x) = lim 
y→+∞
F(x, y) = ∫x
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy 
为 X 的边缘分布函数,及 
fX(x) = F′X
(x) = ∫x
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy′ 
= ∫+∞ 
.∞ 
f(x, y)dy 
称为 X 的边缘密度函数。 
类似地,FY (y) = lim 
x→+∞
F(x, y) 为 Y 的边缘分布函数,fY (y) = ∫+∞ 
.∞ 
f(x, y)dx 为 
Y 的边缘密度函数。 
例 3-11 设二维随机向量 (X, Y ) 的概率密度为 
f(x, y) =8<:
1, 0 < x < 1, |y| < x 
0, 其他 
计算边缘密度函数 fX(x)。 
解:根据边缘密度的计算公式,对任意的 x ∈ R,fX(x) = ∫+∞ 
.∞ 
f(x, y)dy。
109 
f(x, y) 的非零区域 D = {(x, y)|0 < x < 1, |y| < x}(如图 3-7 所示),故对 
x /∈ (0, 1), f(x, y) = 0,此时 ∫+∞ 
.∞ 
f(x, y)dy = 0。今设 x ∈ (0, 1)。此时 ∫+∞ 
.∞ 
f(x, y)dy = 
∫x
.x 
dy = 2x。 
综上所述, 
fX(x) =8<:
2x, 0 < x < 1 
0, 其他 
图 3-7 平面上 f(x, y) 取非零值的区域 D = {(x, y)|0 < x < 1, |y| < x} 
练习 3-11 计算例 3-11 中 2-维随机向量 (X, Y ) 的边缘密度函数 fY (y)。 
参考答案:fY (y) =8>
>><>
>>:
1 + y, .1 < y < 0 
1 . y, 0 . y < 1 
0, 其他 
。 
例 3-12 设 (X, Y ) 的概率密度函数为 
f(x, y) = 
1 
2πσ1σ2p1 . ρ2 
e. 1 
2(1.ρ2)((x.μ1)2 
σ2
1 .2 (x.μ1)(y.μ2) 
σ1σ2 
+(y.μ2)2 
σ2
2 ), (x, y) ∈ R2 
称 (X, Y ) 服从参数为 μ1, μ2, σ2
1, σ2
2, ρ 的2-维正态分布,记为 (X, Y )~N(μ1, μ2, σ2
1, σ2
2, ρ)。 
密度函数 z = f(x, y) 的图形如图 3-5 所示。 
为了计算 X 的边缘密度函数 fX(x),对 f(x, y) 的表达式中的指数的 2 次式进行 
配方运算 
(x . μ1)2 
σ2
1 .2ρ
(x . μ1)(y . μ2) 
σ1σ2 
+
(y . μ2)2 
σ2
2 
= y . μ2 
σ2 . ρ
x . μ1 
σ1 2
+(1.ρ2) 
(x . μ1)2 
σ2
1